1作者: ZOdex7 天前
我正在构建一个封装器,它会查询 GPT-4、Claude 和 Gemini,然后在沙盒中执行它们的代码以捕捉幻觉。<p>30 秒的延迟换取确定性,这值得吗?还是你更喜欢速度?<p>我今天正在为人们进行手动测试,如果有人想尝试,请联系我。
5作者: tsazan7 天前
大家好,我是CommerceTXT的作者。<p>我构建CommerceTXT是因为我厌倦了从HTML中提取价格和库存数据的脆弱性。目前的AI代理仅仅为了解析一个产品页面,就要浪费大约8000个token,结果却会虚构价格或者遗漏“缺货”的信息。<p>CommerceTXT是一个严格的、只读的文本协议(CC0公共领域),旨在为代理提供确定的事实依据。可以把它想象成`robots.txt` + `llms.txt`,但专门为交易而设计。<p>v1.0的关键技术决策:<p>1. *分形架构:* 根目录 -&gt; 类别 -&gt; 产品文件。代理只获取它们需要的内容(节省带宽/token)。<p>2. *严格只读:* v1.0 故意排除了交易/操作,以避免安全问题。它纯粹是上下文信息。<p>3. *Token效率:* 一个典型的产品定义大约需要380个token,而HTML等价物则需要大约8500个token。<p>4. *反幻觉:* 包含诸如带有时间戳的@INVENTORY和带有验证来源的@REVIEWS等指令。<p>该规范已经上线并开放。我非常欢迎您对指令结构,尤其是我们正在探索的“信任与验证”概念提出反馈意见。<p>规范:<a href="https://github.com/commercetxt/commercetxt" rel="nofollow">https://github.com/commercetxt/commercetxt</a> 网站:<a href="https://commercetxt.org" rel="nofollow">https://commercetxt.org</a>
1作者: KirisameMarisa7 天前
我开发了 VideoReview,旨在减轻团队成员在游戏过场动画、小品制作中的审核负担。<p>它允许协作者留下基于时间的评论,直接在视频帧上绘图,并在类似 SNS 的轻量级界面中讨论反馈。<p>集成的功能包括 JIRA(从评论中创建任务)和 Slack(分享评论)。<p>我非常希望收到对这款软件可用性的反馈,尤其是来自审核游戏或动画素材的人!
2作者: andrelinhk7 天前
大家好,HN!我们是来自新加坡国立大学(本科生 + 博士生)的小团队。PaperDebugger 最初是一个研究项目,后来发展成一个开源工具,可以直接集成到 Overleaf 中,作为学术写作助手。它提供 LaTeX 感知的调试、审稿人风格的反馈和有针对性的修订建议,无需离开编辑器,非常适合已经在 Overleaf 上撰写和协作项目的用户。 在上周,一个小规模的 Beta 版本获得了超出我们预期的关注。它远非完美,但由于已经有人开始试用,我们决定更广泛地分享它,并优先考虑稳定性和可靠性,以及比原计划更早地收集反馈。 无需注册:安装 Chrome 扩展程序后,它会立即附加到您的 Overleaf 项目。您可以突出显示任何部分并接收特定建议、问题报告或多步骤修订过程。在后台,它会读取您的项目结构,并由我们基于自定义 MCP 的编排引擎提供支持,该引擎模拟“研究 → 批判 → 修订”的工作流程,而不是单个聊天提示。 试用一下: Chrome 扩展程序(Overleaf 集成): [https://chromewebstore.google.com/detail/paperdebugger/dfkedikhakpapbfcnbpmfhpklndgiaog](https://chromewebstore.google.com/detail/paperdebugger/dfkedikhakpapbfcnbpmfhpklndgiaog) 登陆页面(演示 + 概述): [https://www.paperdebugger.com/](https://www.paperdebugger.com/) 我们正在寻找什么: * Overleaf 嵌入式工作流程是否真的比复制/粘贴 LLM 编辑更有用 * 关于 Overleaf 编辑器内 UX 和交互的看法 * 任何担忧,例如关于隐私或扩展行为(我们已发布相关政策) * 有助于会议/期刊投稿的功能请求(我们目前正在开发格式化程序、引用验证器) 对于对促使该系统产生的技术细节和研究背景感兴趣的读者,这里是论文的链接:[https://arxiv.org/abs/2512.02589](https://arxiv.org/abs/2512.02589) 很乐意回答有关架构、MCP 设计、提示或任何其他问题的提问。