2 分•作者: natalcleft•28 天前
返回首页
最新
5 分•作者: lostathome•28 天前
大家好。
我一直在开发 Hitoku Draft,这是一个完全在本地运行的、开源的、语音优先的 AI 助手。我之前已经发布过相关信息,现在它还增加了语音编辑的转录功能。我希望获得反馈,因为我发现,在科技圈之外,很多人仍然不太使用这项技术。
它具有上下文感知能力,这意味着它可以读取你的屏幕、文档和活动应用程序,以了解你正在处理的内容。你可以通过语音询问 PDF 文件、回复电子邮件、创建日历事件、进行网络搜索、编辑文本等。
你可以使用代码 HITOKUHN2026 免费下载编译好的版本:[https://hitoku.me/draft/](https://hitoku.me/draft/) (基础价格为 5 美元)。
它支持 Gemma 4 和 Qwen 3.5 进行文本生成,以及多种语音转文本(STT)后端(Parakeet, Qwen3-ASR)。
示例:
- Gemma4 的实际应用:[https://www.youtube.com/watch?v=OgfI-3YjEVU](https://www.youtube.com/watch?v=OgfI-3YjEVU)
- 查询 PDF 文档:[https://www.youtube.com/watch?v=ggaDhut7FnU](https://www.youtube.com/watch?v=ggaDhut7FnU)
- 回复电子邮件:[https://www.youtube.com/watch?v=QFnHXMBp1gA](https://www.youtube.com/watch?v=QFnHXMBp1gA)
- 以及常规的语音听写(可选择性润色)。
我目前经常使用它来配合 Claude Code 和 Logseq。现在,我们正与一些朋友一起开发一个新的跨平台版本。长远目标是让本地 AI 交互模型为大众和专业人士服务。
21 分•作者: rozumem•28 天前
1 分•作者: el_al•28 天前
1 分•作者: dukebartnik•28 天前
1 分•作者: latein•28 天前
1 分•作者: Ariarule•28 天前
1 分•作者: jger15•28 天前
1 分•作者: ksymph•28 天前
2 分•作者: thm•28 天前
1 分•作者: tanelpoder•28 天前
1 分•作者: ortr•28 天前
2 分•作者: wavesound•28 天前
1 分•作者: AdilZtn•28 天前
32 分•作者: meetpateltech•28 天前
50 分•作者: mawise•28 天前
1 分•作者: Bender•28 天前
1 分•作者: gsgreen•28 天前
1 分•作者: speckx•28 天前
1 分•作者: tessbi•28 天前