49 分•作者: tamnd•11 天前
返回首页
最新
7 分•作者: nazarh•11 天前
大家好,HN — 我想写个人博客已经好几年了,但一直犹豫不决。
我私下写了很多东西(笔记、小短文、思考问题)。保罗·格雷厄姆认为写文章是学习的一种方式,这让我深有同感。但我很少发表任何东西,除了偶尔在领英上发帖。
我的阻碍:
•“没人需要看这个” / “这没什么新意”
•“AI 可以比我更好地解释大多数话题”
• 一点点恐惧:发布一些感觉幼稚或信息量不大的东西
与此同时,我读了很多个人博客和领英文章,确实从中获得了真正的价值——主要来自观点、生活经验和清晰的思考,而不是新奇的东西。
对于那些写博客(或曾经写过)的人:
•是什么让您觉得值得写下去?
•什么样的帖子真正有效(对学习、职业、人脉、机会有帮助)?
•有什么降低门槛的实用格式(长度、频率、主题)?
•如果今天开始写博客,您会怎么做?
我并不想建立一个媒体业务——更像是建立一个“公开的笔记本”,可以随着时间的推移不断积累。
1 分•作者: akyuu•11 天前
1 分•作者: gnabgib•11 天前
1 分•作者: handfuloflight•11 天前
1 分•作者: floships•11 天前
重新加载以生成随机梯度。按下分享按钮以固定种子。访问 /clean 以隐藏用户界面。
1 分•作者: ditegashi•11 天前
嘿,HN,过去几个月我一直在开发一个氛围营销平台,作为我的主要副业项目。今天进行(非常)小范围的发布,主要是因为我想用它来挑战我们对AI生成内容的看法(有些人称之为SLOP——请耐心听我说)。
PostKing的工作原理:
我创建一个你现有内容的统计模型——博客、社交帖子、大学作业,任何你写过的东西。
它学习你的品牌声音、语调和定位——不仅仅是表面的写作风格,而是你真正的思考方式。
在任何渠道上生成听起来像你自己的内容,而不是通用的AI垃圾。
我从你的内容中提取这些指纹:
文体学:
* 功能词频率(the, a, and等)——标准化比率
* 词汇多样性:马修斯(类型-标记)、尤尔的K、辛普森
* 标志性短语(TF-IDF):
* 前10个二元词组
* 前10个三元词组
* 前15个独特词汇(长度>3)
情感:
* 总分
* 情感标记:喜悦、悲伤、愤怒、恐惧、惊讶(标准化)
* 情感变化(句子级偏差)
模式:
* 搭配:频繁的两个词的组合(≥2次出现,前20名)
* 重复短语:三个词的短语(≥2次出现,长度>10,前10名)
* 结构模板:问题、感叹、列表、引言
* 修辞:
* 隐喻密度(每句中的like/as/is指示词)
* 头韵频率(每句中相邻的相同字母开头)
* 平行结构实例(每句中重复的结构)
* 重复词实例(每句中重复的句子开头)
这是一个简单的模型,但我希望它比大多数AI写作工具使用的“提示和祈祷”方法更好。从根本上说,我觉得大多数AI内容工具为了数量而牺牲了真实性,这导致了一场恶性竞争。这种错位促使我开发了这个工具。
由于这是小范围发布,声音训练算法仍在完善中。你不会得到糟糕的输出,但你的输入内容越多样,它捕捉到的细微差别就越好。与此同时,我开放了免费的alpha账户,如果有人想用自己的品牌测试它。
如果你使用应用程序中提供的反馈链接,我很乐意向你发送更多积分。
编辑:如果大家有兴趣,我很乐意分享更多关于声音保留的技术方法——这不仅仅是微调,还涉及很多上下文层面的工作。
1 分•作者: gnabgib•11 天前
1 分•作者: doener•11 天前
2 分•作者: stareatgoats•11 天前
1 分•作者: type0•11 天前
2 分•作者: measurablefunc•11 天前
33 分•作者: fi-le•11 天前
1 分•作者: parsabg•11 天前
嗨,HN,
我们是 Amin 和 Parsa,很高兴与大家分享 DataKit,这是一个完全基于浏览器的、数据分析平台,让您可以在浏览器标签页中直接处理大型数据集,无需服务器、无需设置,并且数据不会离开您的机器。
* GitHub: [https://github.com/datakitpage/datakit](https://github.com/datakitpage/datakit)
* 在线演示: [https://datakit.page](https://datakit.page)
DataKit 使用编译成 WebAssembly 的 DuckDB 在客户端完全处理多千兆字节数据集(CSV、Parquet、JSON、Excel)。您的数据保留在本地浏览器中,默认情况下不会上传到任何地方。
我们对必须在需要上传敏感数据的云工具和安装维护起来很麻烦的重量级本地设置之间做出选择感到沮丧。我们想要一个只需在浏览器标签页中就能运行,但仍然具有真正分析能力的东西。
它的一些核心功能包括:
* 客户端处理大型文件(已测试高达约 20GB),无需后端
* 由 DuckDB-WASM 驱动的完整 SQL 接口
* 通过 Pyodide 进行数据科学工作流程的 Python 笔记本
* 通过代理可选地连接到远程源(Postgres、MotherDuck、S3)
* AI 助手,仅查看模式和元数据——从不查看原始数据
许可:DataKit 采用 AGPL 许可,提供企业使用的商业许可。
在过去的几个月里,我们一直在将 DataKit 作为副项目进行构建,非常希望收到关于以下方面的反馈:
* 您遇到的性能瓶颈
* 您工作流程所需的功能
* 关于全客户端架构与混合方法的看法
感谢您的关注,我们很乐意回答任何问题。
— Amin & Parsa
1 分•作者: lafalce•11 天前
1 分•作者: dorongrinstein•11 天前
1 分•作者: Vermin2000•11 天前
3 分•作者: pablo24602•11 天前
1 分•作者: herbertl•11 天前
1 分•作者: hiddenseal•11 天前