2作者: ghita_7 个月前
Hello HN, 我是 Ghita,ZeroEntropy(YC W25)的联合创始人。我们为 RAG 和 AI 智能体构建高精度搜索基础设施。 我们刚刚发布了两个新的、最先进的重排序器 zerank-1 和 zerank-1-small。其中一个完全开源,采用 Apache 2.0 许可证。 我们使用一种新颖的、受 Elo 评分启发的流程训练了这些模型,我们在附带的博客中详细描述了该流程。简而言之,以下是训练步骤的概述: * 使用一组 LLM 收集文档对之间的软偏好。 * 拟合一个 Elo 风格的评分系统(Bradley-Terry),将成对比较转化为每个文档的绝对评分。 * 使用偏差校正步骤(使用跨查询比较建模并使用 MLE 求解)来规范化跨查询的相关性评分。 您可以通过我们的 API(<https://docs.zeroentropy.dev/models>)或 HuggingFace(<https://huggingface.co/zeroentropy/zerank-1-small>)试用这些模型。 我们非常欢迎社区对这些模型和训练方法的反馈。一份完整的技术报告也即将发布。 谢谢!
1作者: ErkanCevher7 个月前
我们开发了一款由人工智能驱动的数据报告程序。我注意到,创始人、分析师和主管们在掌控自身数据方面面临着问题。他们要么需要等待团队提供数据报告,要么被复杂的编码所困扰。我们希望通过创建一个能在几秒钟内完成操作且无需编码的工具来解决这个问题。用户可以上传他们的数据(Excel、CSV、MySQL 文件等),然后用自然语言提出任何问题。他们将获得交互式仪表盘,可以更改颜色、大小、图表类型等。如果您试用,请留下您的反馈,提前感谢。
2作者: jczhang1417 个月前
大家好,我是 James,MetaMCP 的作者。我们最近重写了 MetaMCP 2.0,诚邀您测试这款新应用。它开源且采用 MIT 许可证。 工作原理: * 将 MCP 服务器分组到命名空间中 * 将它们作为统一的 meta-MCP 端点公开(在 MCP 中使用 SSE 或 SHTTP,或使用 openapi.json 在 Open Web UI 等中) * 插入中间件:广泛使用的一个是过滤掉未使用的工具。 更多功能即将推出,例如日志记录、人工介入、安全防护,您也可以在 GitHub 上提出问题进行讨论 * 预构建的 Docker 镜像,可快速设置 您可能会觉得有趣的地方: * 我们预热空闲会话以减少冷启动延迟 * 您可以通过内置的 MCP 检查器进行调试 * 您甚至可以在一个 MetaMCP 中运行多个 MetaMCP(是的,我们试过了) 快速演示视频:[https://youtu.be/Cf6jVd2saAs](https://youtu.be/Cf6jVd2saAs) GitHub 仓库:[https://github.com/metatool-ai/metamcp](https://github.com/metatool-ai/metamcp) Docker 镜像:ghcr.io/metatool-ai/metamcp:latest 欢迎提出您的反馈或功能请求,谢谢!
1作者: gethly7 个月前
如果你运营的是一个多语言网站,你是如何处理偶尔需要将几句话翻译成多种语言的情况的? 我投入了大量时间和金钱来支持网站用户界面上的 9 种(目前)语言,但随着时间的推移以及新功能和变化的出现,我有时需要在各处添加新的文本。通常不会太长,2、3、4 句话。偶尔加一个词。 为了这么点小活儿就去麻烦个别翻译人员,这毫无意义。翻译机构贵得离谱(根据我的经验,是个人翻译价格的 4 倍),所以我只能求助于基本的谷歌翻译,但不幸的是,它还停留在 2010 年,翻译结果并不好。 我还没有找到针对这种情况的“Fiverr”替代方案,所以我想知道大家有没有什么不同的做法?
3作者: itzlambda7 个月前
嘿,HN! 我经常遇到这种情况:“我肯定收藏过一个能做 X 的仓库……但它叫什么来着?” 如果你收藏了很多仓库,手动查找确切的仓库会非常麻烦,尤其是在 GitHub 的收藏搜索界面不太好用的情况下。 这就是我制作这个工具的原因。它使用向量嵌入,让你能够使用自然语言搜索你的 GitHub 收藏。初始版本的后端是用 Python 编写的(vibe 编码)。最近我用 Rust 重写了后端,因为我对 vibe 编码的实现不太有信心。 有一个切换开关可以启用“全局搜索”,它会搜索所有已索引的仓库(不仅仅是你的收藏)。这可能会帮助你找到你尚未收藏的新仓库。 希望它对你有所帮助。 Github: <a href="https:&#x2F;&#x2F;github.com&#x2F;itzlambda&#x2F;starscout">https:&#x2F;&#x2F;github.com&#x2F;itzlambda&#x2F;starscout</a> 展示帖: <a href="https:&#x2F;&#x2F;x.com&#x2F;itzlambda&#x2F;status&#x2F;1904878939073294825" rel="nofollow">https:&#x2F;&#x2F;x.com&#x2F;itzlambda&#x2F;status&#x2F;1904878939073294825</a>
1作者: amichail7 个月前
参与者需要找到他们认为最有趣的模式,然后证明它始终成立。<p>发现并证明更有趣的模式可以获得更多分数。<p>这似乎是人工智能更难完成的任务。
2作者: GavinAnderegg7 个月前
今天早上我的搜索时断时续地出现问题,但现在每次查询都会导致这个错误: <p> <pre> <code> 抱歉,显示这些结果时遇到了错误。点击这里重试。 </code> </pre> 我尝试寻找官方状态页面,但没找到。也就是说,其他人似乎也遇到了同样的问题:https://downdetector.com/status/duckduckgo/ <p> 编辑:他们在搜索结果页面更新了以下内容,在没有结果返回后显示: <p> <pre> <code> 我们正在经历中断。 感谢您的耐心等待,我们正在努力解决问题! </code> </pre>
1作者: abhinav957 个月前
我构建了一个开源命令行工具,允许你使用自然语言查询 Git 提交历史记录。<p>例如,你可以这样问:<p>•“登录功能是什么时候添加的?” •“身份验证流程做了哪些改动?”<p>它使用可配置的模型(Hugging Face 或 OpenAI)为提交信息生成嵌入,并将它们存储在 ChromaDB 中,然后通过 LangChain 使用 GPT 进行语义查询。<p>功能: • 快速本地搜索(本地存储) • 自然语言查询界面 • 基于 Typer 的简单命令行工具,包含用于列出和管理嵌入的命令<p>非常适合希望以更智能的方式探索版本历史记录的开发人员。<p>欢迎提供反馈和贡献。