HackerNews中文版

大家好！我们构建了 SQLFlow，一个轻量级的流处理引擎。我们利用 DuckDB 作为流处理引擎，这使得 SQLFlow 能够以每秒处理数万条消息的速度运行，同时仅需约 250MB 内存！ DuckDB 还支持丰富的接收器和连接器生态系统！ [https://sql-flow.com/docs/category/tutorials/](https://sql-flow.com/docs/category/tutorials/) [https://github.com/turbolytics/sql-flow](https://github.com/turbolytics/sql-flow) 我们厌倦了为简单的流处理运行 JVM，也厌倦了定制的一次性流处理器。我很乐意听取您的反馈、批评和/或经验！谢谢

Show HN: Diesel-guard – 检查 Diesel 迁移中不安全的 PostgreSQL 模式

2 分•作者: ayarotsky•7 个月前

Launch HN: Nia (YC S25) – 为代码编写助手提供更好的上下文

17 分•作者: jellyotsiro•7 个月前

大家好，我是 Arlan，我正在构建 Nia (<a href="https://trynia.ai" rel="nofollow">https://trynia.ai</a>)，一个用于 AI 编码助手的 SOTA 上下文层。Nia 允许 Cursor、Claude Code 和其他 MCP 客户端等工具索引和查询真实的代码库和文档，这样它们就不会再对过时或错误的信息产生幻觉，其应用范围超越了编码助手，扩展到任何需要在不同领域提供可靠上下文的 AI 系统。编码助手的表现取决于你提供给它们的上下文。通用模型是在通常已过时的公共代码和文档上训练的，而且它们通常不知道你的实际代码库、内部维基或你使用的第三方 SDK 的确切版本。结果大家都很熟悉：你将 URL 和代码片段粘贴到提示中，助手却自信地使用了过时的 API 或错误的框架版本，你花费在验证和纠正上的时间比你自己编写代码还要多。一旦模型在生成代码方面足够出色，为它们提供精确、最新的上下文就成为了瓶颈。我最初是在我自己的项目上遇到这种情况的，当时（几个月前）我还在哈萨克斯坦读高中，痴迷于代码生成工具，并尝试了所有我能找到的编码助手。后来我进入了 YC，并与其他也在尝试在实际工作中应用助手的团队进行了交流，再次看到了这个问题。 Nia 的第一个版本基本上是“我的个人 MCP 服务器，它知道我的代码库和我最喜欢的文档站点，这样我就不必再将 URL 粘贴到 Cursor 中了。” 一旦我看到自己的工作流程变得多么顺畅，就觉得这应该是一个其他人也可以使用的产品。在底层，Nia 是一个具有 MCP 接口和 API 的索引和检索服务。你将它指向 GitHub 存储库、框架或提供商文档、SDK 页面、PDF 手册等来源。我们使用一些简单的启发式方法来获取和解析这些内容，包括代码结构、标题和表格，然后将它们规范化为块，并构建几个索引：一个用于自然语言查询的语义索引，带有嵌入；一个用于函数、类、类型和端点的符号和用法索引；一个文件、符号和外部文档之间的基本引用图；以及用于需要对原始文本进行确定性匹配的情况的正则表达式和文件树搜索。当助手调用 Nia 时，它会发送一个自然语言查询，以及可选的提示，如当前文件路径、堆栈跟踪或存储库。Nia 运行 BM25 风格的搜索、嵌入相似度和图遍历的组合，以对相关代码片段进行排序，并且还可以返回精确的位置，例如“此文件中的此函数定义及其使用的三个地方”，而不仅仅是一个模糊的段落。然后，调用助手决定如何在自己的提示中使用这些代码片段。一个 Nia 部署可以同时服务于多个助手和多个项目。例如，你可以让 Cursor、Claude Code 和一个基于浏览器的助手都指向同一个 Nia 实例，该实例知道你的单体仓库、你的内部维基和你关心的提供商文档。我们保留了一个与助手无关的会话记录，用于跟踪使用了哪些来源以及用户接受了哪些代码片段。任何 MCP 客户端都可以附加到该会话 ID，获取当前上下文并扩展它，因此切换工具并不意味着丢失已经发现的内容。为了在不重新处理所有内容的情况下保持索引的最新状态，我们做了大量的工作。后台工作程序会定期重新获取配置的来源，检测哪些文件或页面发生了更改，并逐步重新索引这些内容。这很重要，因为我看到的大多数最糟糕的“幻觉”实际上是模型引用了错误版本的有效文档。解决这个问题更多的是关于版本和更改跟踪，而不是关于模型质量。我们随 Nia 提供了一组不断增长的预索引公共来源。今天，这包括来自常见框架和提供商文档的大约 6000 个软件包，以及对来自 PyPI、npm 和 RubyGems 等生态系统的数千个库的软件包搜索，以及预索引的 /explore 页面，每个人都可以在其中贡献他们的来源！我们的想法是，新用户可以安装 Nia，不连接任何东西，仍然可以获得常见库的有用答案。然后，一旦你添加了自己的代码库和内部文档，这些私有来源就会合并到同一个索引中。到目前为止，人们使用 Nia 的一些例子包括：- 通过索引提供商文档以及示例代码库，并让助手提出和迭代补丁，从而从一个支付提供商或 API 版本迁移到另一个；- 通过直接索引框架源代码来回答“我如何在框架中执行 X”，而不是仅仅依赖可能已过时的官方文档；- 将不熟悉的代码库变成一个临时的维基，以便自我入门，你可以在其中提出结构性问题并跳转到特定文件、函数或提交；- 构建一个浏览器助手，即使公共文档滞后，也能使用最新的代码和文档来回答问题。 Nia 是一个付费产品 (<a href="https://www.trynia.ai/" rel="nofollow">https://www.trynia.ai/</a>)，但我们有一个免费套餐，应该足以供个人在实际项目上试用。除此之外，还有一个针对更重度个人使用的自助付费计划，以及具有更高限制、SOC 2、基于席位的计费以及希望在其自身环境中进行索引的团队的选项的组织计划。对于私有 GitHub 存储库，我们可以在本地克隆和索引，因此代码不会离开你的基础设施。我们存储帐户详细信息和基本遥测数据，如查询计数和错误，以运营该服务，并且我们存储你明确连接的内容的处理表示形式（块、元数据、嵌入和小型图），以便我们可以回答查询。我们不会在客户内容上训练基础模型，也不会出售用户数据。此外，由于向这些系统提供可靠上下文的全球性问题，我可以看到 Nia 在助手的更大背景下发挥作用。早期信号表明，人们已经开始使用 Nia 处理医疗保健数据，通过索引保罗·格雷厄姆的所有文章并将其变成 AI 助手来克隆他，使用 Naval 的档案来构建个性化助手等等。我很乐意让更多已经在努力推动编码助手的工程师使用 Nia，并看看它在哪里会崩溃。我特别感兴趣的是听取关于失败模式、烦人的入门步骤、检索逻辑明显错误或不完整的地方，或者我应该解决的任何安全问题的反馈。我将参与讨论以回答问题，分享更多技术细节，并收集你愿意提供的任何严厉反馈！

安息吧，山内テツ（前Free乐队和Faces乐队贝斯手）

5 分•作者: pauseandplay•7 个月前

Legion Health (YC S21) 正在招聘创始工程师（旧金山，现场办公）

1 分•作者: the_danny_g•7 个月前

Legion Health (YC S21) 运营一家精神科诊所，正在构建面向心理健康护理的 AI 原生运营层。我们专注于运营后端：排程、入院、文档、计费和护理协调。这些工作流程——而非诊断——是心理健康服务的主要瓶颈。我们运营自己的诊所，因此你构建的系统将直接应用于真实的患者护理。我们目前的智能代理基础设施支持超过 2,000 名患者，仅由一位人工支持主管负责。我们正在招聘一名创始工程师（现场办公，旧金山）。你将直接与创始人合作，负责： * 事件驱动的后端系统 (Node.js, TypeScript, Postgres/Supabase, AWS) * LLM 代理工具 (工具使用、重试、记忆、上下文管理) * 供人类和代理使用的内部运营工具 * 代表患者旅程的状态/协调逻辑 * 符合 HIPAA 规范的数据和审计管道我们欢迎具备系统思维并拥有完整工作流程端到端经验的后端或全栈/产品工程师。拥有 LLM 相关经验并非必要条件，但需要对此感兴趣。详情：全职，旧金山现场办公，薪资 13 万美元 – 18 万美元，股权 0.1% – 0.6%。在此申请： [https://www.ycombinator.com/companies/legion-health/jobs/oc6nPUu-founding-engineer-ai-native-ops-infrastructure-yc-s21-2m-arr-6-3m-raised](https://www.ycombinator.com/companies/legion-health/jobs/oc6nPUu-founding-engineer-ai-native-ops-infrastructure-yc-s21-2m-arr-6-3m-raised)

莱利亚相机：为你的生活配乐

1 分•作者: xnx•7 个月前

微软遇到了一个问题：没人想买或使用它那质量差劲的 AI 产品。

4 分•作者: mohi-kalantari•7 个月前