3作者: primaprashant7 个月前
使用 hns,这是一款语音转文本命令行工具,可将您通过麦克风输入的语音直接转录到剪贴板。将 hns 与 Claude Code、Ollama、LLM 等命令行工具集成,实现强大的工作流程。 hns 使用 faster-whisper 在本地 100% 转录您的语音。 Whisper 模型会在首次运行时自动下载,之后,hns 就可以完全离线使用了。转录完成后,文本会显示在终端中(写入标准输出),并自动复制到您的剪贴板,您可以使用 Ctrl+V 或 Cmd+V 将其粘贴到任何地方。 GitHub:<a href="https:&#x2F;&#x2F;github.com&#x2F;primaprashant&#x2F;hns&#x2F;" rel="nofollow">https:&#x2F;&#x2F;github.com&#x2F;primaprashant&#x2F;hns&#x2F;</a>
12作者: kbyatnal7 个月前
我搭建了 OCR 竞技场,作为一个免费的平台,供社区并排比较领先的基础视觉语言模型(VLM)和开源 OCR 模型。<p>上传任何文档,衡量准确性,并(可选)在公共排行榜上为模型投票。<p>目前已包含 Gemini 3、dots.ocr、DeepSeek、GPT5、olmOCR 2、Qwen 等。如果您希望添加其他模型,请告诉我!
2作者: fraserphysics7 个月前
这是SIAM出版的本书第二版草稿。 [https://epubs.siam.org/doi/book/10.1137/1.9780898717747?mobileUi=0](https://epubs.siam.org/doi/book/10.1137/1.9780898717747?mobileUi=0) 需要展示三件事: 1. 草稿的PDF:[https://www.fraserphysics.com/book.pdf](https://www.fraserphysics.com/book.pdf) 2. hmm项目,提供状态空间模型的代码: [https://gitlab.com/fraserphysics/hmm](https://gitlab.com/fraserphysics/hmm),文档见 [https://fraserphysics.gitlab.io/hmm/](https://fraserphysics.gitlab.io/hmm/) 3. hmmds项目,提供使用状态空间模型解决一些示例的代码: [https://gitlab.com/fraserphysics/hmmds](https://gitlab.com/fraserphysics/hmmds),文档见 [https://fraserphysics.gitlab.io/hmmds/](https://fraserphysics.gitlab.io/hmmds/)。hmmds的默认目标是构建这本书。在我的家庭系统上,构建这本书大约需要10个小时。 非常欢迎对这三件事的任何方面提出意见或建议。 我特别希望在以下方面获得帮助: 1. 我使用NixOS进行开发。我已经在[https://fraserphysics.gitlab.io/hmmds/getting_started.html](https://fraserphysics.gitlab.io/hmmds/getting_started.html)记录了在其他环境中使代码有用的进展。如果您能在其他地方使用该代码,请告诉我。 2. 在本书的草稿中,我分析了EM算法的收敛性质,分散在第43页的第2.5节“EM算法”和第137页的附录B“EM收敛速度”之间。该分析与我见过的任何已发表的内容都不同。我希望获得反馈,包括更正和/或引用。