2 分•作者: harambae•6 个月前
返回首页
最新
1 分•作者: sathishmanohar•6 个月前
1 分•作者: Michelangelo11•6 个月前
2 分•作者: mickelsen•6 个月前
1 分•作者: swyx•6 个月前
1 分•作者: amalinovic•6 个月前
1 分•作者: Gigacore•6 个月前
2 分•作者: todsacerdoti•6 个月前
2 分•作者: VarunGuptaHAI•6 个月前
嗨,HN,
我们是 HelpingAI 背后的团队,一直在尝试各种方法,以使 LLM 推理更快、更高效,尤其是在解决复杂的任务时,例如数学问题、编码问题和逻辑谜题。
在对我们较早的推理模型进行微调的过程中,一个错误意外地在响应中间引入了一个“思考”标签。这个错误并没有破坏模型,反而创建了一个类似链式思考的中间步骤——而且模型的表现更好了。这个错误启发我们去探索现在我们称之为“中间推理”的技术。
我们通过在 3 万亿个推理专用数据(为多阶段推理任务精心策划)上微调 Qwen3-14B 模型,将这项技术规模化,结果令人震惊:
* 推理速度比 DeepSeek-R1、Grok 和 OpenChat 等模型快 5 倍。
* 显著降低了 token 使用量和延迟,非常适合初创企业和实时用例。
* 在几秒钟内解决基准级别的数学和逻辑问题,而不是几分钟。
例如,在一个困难的数学基准测试中:
* Dhanishtha-2.0 在 45 秒内解决
* DeepSeek-R1 耗时 280 秒以上
你可以在这里尝试:
* 聊天/API 访问:[https://helpingai.co](https://helpingai.co)
* 模型权重(开源):[https://huggingface.co/HelpingAI/Dhanishtha-2.0-preview](https://huggingface.co/HelpingAI/Dhanishtha-2.0-preview)
我们非常欢迎反馈、想法,尤其是你认为它可能出错(或让你感到惊喜)的边缘情况。
我们很乐意回答任何问题,并深入探讨训练数据、微调策略、评估或基础设施!
谢谢,
Varun Gupta
联合创始人,HelpingAI
1 分•作者: jruohonen•6 个月前
2 分•作者: adityaathalye•6 个月前
1 分•作者: iamflimflam1•6 个月前
1 分•作者: andsoitis•6 个月前
1 分•作者: LambriniWorks•6 个月前
上周我分享了 Cheesy Mamas 的第一个版本,这是一个用 Python 和 PyQt6 编写的本地文本编辑器。它完全离线运行,没有插件、遥测、账户或同步功能。其重点是直接编辑,界面内置了 Git 和 Bash 支持。最初的帖子悄然流传开来。我花了一些时间,根据大家的反馈准备了下一个版本。<p>这个新版本增加了可用的 deb 包。它将编辑器系统范围地安装,带有启动器、图标和桌面条目。编辑器使用中继文件支持单实例行为,因此从文件管理器或终端启动会在现有窗口中打开一个新标签。此版本还添加了一个可用的运行按钮。Python 脚本直接运行,C 文件使用 gcc 编译和执行,LaTeX 使用 pdflatex 运行。还有一个 Bash 按钮,允许您粘贴 Bash 指令以按命令运行,或随时添加新指令。<p>Git 系统是投入最多工作的地方。原始视图已扩展为每个打开文件旁边的完整提交历史面板。您可以选择任何提交来查看该时间点的文件版本。当您这样做时,编辑器会逐行与您当前在内存中的工作版本进行比较。更改的行在上下文中突出显示,可以通过单击一下单独恢复。绿色表示新增,黄色表示已更改,红色表示已删除。这允许本地、隔离的编辑,而无需暂存不相关的文件或启动单独的 diff 工具。右键单击提交会打开一个上下文菜单,用于复制该版本、查看完整 diff 或恢复整个文件。您还可以从编辑器中删除提交。<p>现在有一个并排比较视图。当您单击提交时,编辑器会拆分视图,并在您的工作文件旁边的辅助窗格中加载历史版本。diff 高亮显示器直观地显示两个窗格之间的已删除、插入和修改的块。这允许快速的视觉扫描和块级恢复,而不会丢失您的工作位置。两个编辑器独立滚动。您可以在主窗格中编写和运行,同时参考前一个窗格。<p>没有插件系统,也没有后台索引。代码足够短,可以阅读,并且该应用程序旨在自我解释。您可以阅读源代码并在无需构建步骤的情况下运行它。它使用 Python 3 和 PyQt6 编写,并使用手动 deb 结构打包。唯一的依赖项是 python3 和 python3-pyqt6,如果您想运行 git 并能够编译 LaTeX,您将需要 git 和 pdflatex。它已经在现代 Debian 和 Ubuntu 系统上进行了测试。<p>该项目在此处提供,包括源代码和安装程序,该项目一直在开发中。如果您有其他功能请求,请评论。<p>未来升级:<p>1. 在单击“运行”按钮时,可以通过复选框保持终端打开或关闭,以便于调试。<p>2. 一个“变体”按钮,允许您创建程序的“变体”,其中包含可热插拔的 def、类或值,用于研发或工业环境。<p><a href="https://osf.io/5xs9a/" rel="nofollow">https://osf.io/5xs9a/</a>
1 分•作者: mseri•6 个月前
1 分•作者: mountainview•6 个月前
2 分•作者: Eikon•6 个月前
9 分•作者: selvan•6 个月前
1 分•作者: gone35•6 个月前
1 分•作者: preetsojitra•6 个月前
Hi HN,
我在网上看到一个关于“失败者版领英”的笑话。我觉得这个主意很棒,所以决定做一个简单的版本。
Sinkedin 是一个可以匿名发布关于求职被拒、面试失误和其他职业失败经历的地方。
网站:<a href="https://www.sinkedin.app/" rel="nofollow">https://www.sinkedin.app/</a>
Github:<a href="https://github.com/Preet-Sojitra/sinkedin">https://github.com/Preet-Sojitra/sinkedin</a>
我不是设计师,所以用户界面非常简洁。如果它让你有强迫症,欢迎提交PR。
整个技术栈都运行在免费层上,所以如果流量增加,可能会有一些延迟。我想快速发布它,看看这个想法是否可行,然后再考虑花钱。
欢迎随时提问。