最新

2 分•作者: VarunGuptaHAI•10 个月前

嗨，HN，我们是 HelpingAI 背后的团队，一直在尝试各种方法，以使 LLM 推理更快、更高效，尤其是在解决复杂的任务时，例如数学问题、编码问题和逻辑谜题。在对我们较早的推理模型进行微调的过程中，一个错误意外地在响应中间引入了一个“思考”标签。这个错误并没有破坏模型，反而创建了一个类似链式思考的中间步骤——而且模型的表现更好了。这个错误启发我们去探索现在我们称之为“中间推理”的技术。我们通过在 3 万亿个推理专用数据（为多阶段推理任务精心策划）上微调 Qwen3-14B 模型，将这项技术规模化，结果令人震惊： * 推理速度比 DeepSeek-R1、Grok 和 OpenChat 等模型快 5 倍。 * 显著降低了 token 使用量和延迟，非常适合初创企业和实时用例。 * 在几秒钟内解决基准级别的数学和逻辑问题，而不是几分钟。例如，在一个困难的数学基准测试中： * Dhanishtha-2.0 在 45 秒内解决 * DeepSeek-R1 耗时 280 秒以上你可以在这里尝试： * 聊天/API 访问：[https://helpingai.co](https://helpingai.co) * 模型权重（开源）：[https://huggingface.co/HelpingAI/Dhanishtha-2.0-preview](https://huggingface.co/HelpingAI/Dhanishtha-2.0-preview) 我们非常欢迎反馈、想法，尤其是你认为它可能出错（或让你感到惊喜）的边缘情况。我们很乐意回答任何问题，并深入探讨训练数据、微调策略、评估或基础设施！谢谢， Varun Gupta 联合创始人，HelpingAI

数字垃圾：是什么以及如何减少

1 分•作者: jruohonen•10 个月前

十亿细胞——又一个用Clojure构建的多人游戏演示

2 分•作者: adityaathalye•10 个月前

科技巨头的人均营收有多少？

1 分•作者: iamflimflam1•10 个月前

大跃进，2025年至2050年

1 分•作者: andsoitis•10 个月前

Show HN: CheesyMamas v1.1 – Git Diff 面板最终确定并添加 Bash 支持

1 分•作者: LambriniWorks•10 个月前

上周我分享了 Cheesy Mamas 的第一个版本，这是一个用 Python 和 PyQt6 编写的本地文本编辑器。它完全离线运行，没有插件、遥测、账户或同步功能。其重点是直接编辑，界面内置了 Git 和 Bash 支持。最初的帖子悄然流传开来。我花了一些时间，根据大家的反馈准备了下一个版本。这个新版本增加了可用的 deb 包。它将编辑器系统范围地安装，带有启动器、图标和桌面条目。编辑器使用中继文件支持单实例行为，因此从文件管理器或终端启动会在现有窗口中打开一个新标签。此版本还添加了一个可用的运行按钮。Python 脚本直接运行，C 文件使用 gcc 编译和执行，LaTeX 使用 pdflatex 运行。还有一个 Bash 按钮，允许您粘贴 Bash 指令以按命令运行，或随时添加新指令。Git 系统是投入最多工作的地方。原始视图已扩展为每个打开文件旁边的完整提交历史面板。您可以选择任何提交来查看该时间点的文件版本。当您这样做时，编辑器会逐行与您当前在内存中的工作版本进行比较。更改的行在上下文中突出显示，可以通过单击一下单独恢复。绿色表示新增，黄色表示已更改，红色表示已删除。这允许本地、隔离的编辑，而无需暂存不相关的文件或启动单独的 diff 工具。右键单击提交会打开一个上下文菜单，用于复制该版本、查看完整 diff 或恢复整个文件。您还可以从编辑器中删除提交。现在有一个并排比较视图。当您单击提交时，编辑器会拆分视图，并在您的工作文件旁边的辅助窗格中加载历史版本。diff 高亮显示器直观地显示两个窗格之间的已删除、插入和修改的块。这允许快速的视觉扫描和块级恢复，而不会丢失您的工作位置。两个编辑器独立滚动。您可以在主窗格中编写和运行，同时参考前一个窗格。没有插件系统，也没有后台索引。代码足够短，可以阅读，并且该应用程序旨在自我解释。您可以阅读源代码并在无需构建步骤的情况下运行它。它使用 Python 3 和 PyQt6 编写，并使用手动 deb 结构打包。唯一的依赖项是 python3 和 python3-pyqt6，如果您想运行 git 并能够编译 LaTeX，您将需要 git 和 pdflatex。它已经在现代 Debian 和 Ubuntu 系统上进行了测试。该项目在此处提供，包括源代码和安装程序，该项目一直在开发中。如果您有其他功能请求，请评论。未来升级：1. 在单击“运行”按钮时，可以通过复选框保持终端打开或关闭，以便于调试。2. 一个“变体”按钮，允许您创建程序的“变体”，其中包含可热插拔的 def、类或值，用于研发或工业环境。<a href="https://osf.io/5xs9a/" rel="nofollow">https://osf.io/5xs9a/</a>

HuggingChat 暂时关闭

1 分•作者: mseri•10 个月前

分层推理模型

1 分•作者: mountainview•10 个月前

谷歌称“这并非安全漏洞”，但迅速修复且未公开说明。

2 分•作者: Eikon•10 个月前

WASM 智能体：在浏览器中运行的 AI 智能体

9 分•作者: selvan•10 个月前

评估长篇文本生成中可验证主张的真实性

1 分•作者: gone35•10 个月前

Show HN: 我做了 sinkedn – 一个分享失败和搞砸经历的 LinkedIn

1 分•作者: preetsojitra•10 个月前

Hi HN，我在网上看到一个关于“失败者版领英”的笑话。我觉得这个主意很棒，所以决定做一个简单的版本。 Sinkedin 是一个可以匿名发布关于求职被拒、面试失误和其他职业失败经历的地方。网站：<a href="https://www.sinkedin.app/" rel="nofollow">https://www.sinkedin.app/</a> Github：<a href="https://github.com/Preet-Sojitra/sinkedin">https://github.com/Preet-Sojitra/sinkedin</a> 我不是设计师，所以用户界面非常简洁。如果它让你有强迫症，欢迎提交PR。整个技术栈都运行在免费层上，所以如果流量增加，可能会有一些延迟。我想快速发布它，看看这个想法是否可行，然后再考虑花钱。欢迎随时提问。

Cyber 是一种用于快速、高效且并发脚本编写的新语言。

1 分•作者: 90s_dev•10 个月前

南大洋环流出现重大逆转

1 分•作者: riffraff•10 个月前

无论什么的崛起

1 分•作者: cratermoon•10 个月前

大规模推断

1 分•作者: tzury•10 个月前

白宫声称拥有广泛权力，可以否决 TikTok 禁令和其他法律

16 分•作者: ytpete•10 个月前

机器学习会议应该设立“反驳与批判”专栏

1 分•作者: distalx•10 个月前

迈向有效的事实性主张抽取与评估

2 分•作者: gone35•10 个月前

提问 HN：你写过的最喜欢的小脚本是什么？

3 分•作者: nbbaier•10 个月前

上一页 1...4578 4579 4580 4581 4582...4745 下一页