2作者: rooagi10 个月前
RooAGI (<a href="https:&#x2F;&#x2F;rooagi.com" rel="nofollow">https:&#x2F;&#x2F;rooagi.com</a>) 发布了 Roo-VectorDB,这是一个 PostgreSQL 扩展,专为高维向量数据设计的高性能存储解决方案。 可以在 GitHub 上查看:<a href="https:&#x2F;&#x2F;github.com&#x2F;RooAGI&#x2F;Roo-VectorDB">https:&#x2F;&#x2F;github.com&#x2F;RooAGI&#x2F;Roo-VectorDB</a> 我们选择基于 PostgreSQL 构建,因为它具备现成的元数据搜索能力和经过验证的关系数据库可扩展性。虽然 PGVector 开创了这种方法,但它通常被认为比 Milvus 等原生向量数据库慢。 Roo-VectorDB 基于 PGVector 框架构建,在搜索策略、内存管理和对更高维度向量的支持方面融入了我们自己的优化。 在初步的实验室测试中,使用 ANN-Benchmark,Roo-VectorDB 在 QPS(每秒查询次数)方面表现出与 Milvus 相当或明显更优异的性能。 RooAGI 将继续开发以 AI 为中心的产品,Roo-VectorDB 将作为我们技术栈中的核心存储组件。 我们邀请世界各地的开发者试用当前版本并分享反馈。
2作者: Olshansky10 个月前
我在问 HN: 你们真正有用的本地 LLM 栈是什么样的? 我正在寻找能提供真正价值的东西——不仅仅是一个炫酷的演示。 --- 最近一次互联网中断后,我意识到我需要一个本地 LLM 设置作为备用方案——不仅仅是为了实验和娱乐。 我日常(远程)的 LLM 栈: ``` - Claude Max(每月 100 美元):我进行结对编程的首选。大量使用 Claude 的 Web 和桌面客户端。 - Windsurf Pro(每月 15 美元):喜欢它的多行自动补全功能以及它如何使用剪贴板/上下文感知。 - ChatGPT Plus(每月 20 美元):我的橡皮鸭,编辑器和创意伙伴。我用它做除了代码之外的所有事情。 ``` 这是我目前为我的本地栈拼凑的东西: 工具 ``` - Ollama:用于在本地运行模型 - Aider:Claude-code 风格的 CLI 界面 - VSCode 搭配 continue.dev 扩展:本地聊天和自动补全 ``` 模型 ``` - 聊天:llama3.1:latest - 自动补全:Qwen2.5 Coder 1.5B - 编码/编辑:deepseek-coder-v2:16b ``` 我不担心的事情: ``` - CPU/内存(在 M1 MacBook 上运行) - 成本(在合理范围内) - 数据隐私/被训练(这里不想引发哲学辩论) ``` 我担心的事情: ``` - 实际的实用性(即“感觉”) - 易用性(符合我的肌肉记忆的工具) - 正确性(不是基准测试) - 延迟和速度 ``` 目前:我已经让它工作了。我可以做一个很棒的演示。但它还没有真正有用。 --- 我是谁 ``` - 一家小型初创公司的 CTO(5 位优秀的工程师) - 20 年的编码经验(从 13 岁开始) - 前大厂员工 ```
1作者: Ingver10 个月前
嗨,HN, 我一直在构建一个名为 Memoria 的 AI 智能体实验性记忆系统。它是一个轻量级、加密的后端,通过“情绪强度”对记忆进行排序。 核心功能: - 约 180 MB 占用空间,零外部服务或依赖 - 使用 SQLCipher 进行端到端加密 - 向量搜索(余弦相似度,仅 NumPy) - 基于情绪的强化和遗忘 - 带有缓存层的异步 Python API - CI:pytest, ruff, mypy, 覆盖率通过 Codecov 没有 Pinecone,没有 Redis,没有云基础设施。 GitHub 仓库:<a href="https://github.com/Ingver1/memoria">https://github.com/Ingver1/memoria</a> 欢迎提供反馈、想法或批评。欢迎贡献者!
1作者: seanobannon10 个月前
我开发了一个简单的国际象棋机器人,它结合了 o4-mini 模型和基于 Stockfish 引擎分析的推理能力。它能清晰地解释棋步,提供战术建议,并帮助你理解棋步的优劣。 欢迎在这里体验:<a href="https:&#x2F;&#x2F;www.chesscoachgpt.com&#x2F;" rel="nofollow">https:&#x2F;&#x2F;www.chesscoachgpt.com&#x2F;</a> 期待您的反馈。
1作者: venuur10 个月前
大家好,我是 Carl Morris。在亚马逊、京东和 Stitch Fix 担任了 10 年的数据科学家之后,我决定打造自己的产品。这段旅程最终促成了 Callio 的诞生,这是一款适用于 iOS 的实时 AI 通话助手。我正在与另外两个人一起创业。<p>我们花了大约 9 个月的时间反复试验才找到了正确的产品方向,又花了 3 个月的时间才构建了 Callio 的第一个版本。我很乐意听取大家的反馈!<p># Callio 是做什么的?<p>Callio 是一款 VoIP 软电话,配备 AI 助手,可以实时收听您的通话并建议您接下来该说什么。我们认为它对销售电话特别有帮助,这也是我们目前主要面向的客户群体。<p>您可以通过以下方式自定义 AI 建议:<p>- 上传文档(例如产品表、定价、异议处理指南)<p>- 设置您的销售目标和常见问答<p>您还可以在真实通话之前通过模拟通话进行练习。AI 使用您的资料生成相关的建议,这些建议可以直接使用。<p># 它是如何工作的?<p>将 LLM 连接到实时通话非常困难。我们利用了许多现成的技术,但将它们连接在一起非常困难,需要一些深思熟虑的努力。<p>- 通过 Twilio 的 React Native 库,WebRTC 促进了 VOIP 通话体验。<p>- WebSockets 使我们能够将音频流传输到我们的后端,并将建议传输到移动客户端。<p>- LLM 获取实时转录,并在通话进行时返回建议。原则上,我们对 LLM 提供商持开放态度,但我们最初是围绕 OpenAI 的 API 构建的。<p>- 我们构建了一个增量推荐工作流程,以确保 AI 建议的低延迟,尽管 REST API 涉及延迟。<p>该架构有意精简:<p>- React Native 移动应用程序<p>- 媒体服务器 + 数据/信号服务器<p>- FastAPI(最初),但为了性能,我们将其部分迁移到了 Sanic<p>我们当然可以做得更好。我们的后端数据库和一些数据 API 的扩展变得不必要地复杂。现在我们已经在 APP store 上线了,我们正在仔细重建,以便能够扩展。让实时功能运行良好(尤其是异步和延迟)是一个巨大的学习曲线。如果您有兴趣,我很乐意深入探讨。<p># 接下来是什么?<p>该应用程序已经上线,我们正在进行市场营销以吸引更多用户。我们现在的重点是:<p>- 扩大到最初的 beta 测试者之外<p>- 提高推荐质量和应用内体验<p>- 为非技术用户构建更好的入门体验<p>很乐意听取您的想法或问题,尤其是在架构、用户体验或分发策略方面。该应用程序确实需要注册,我知道这会增加您试用的难度。幸运的是,我们提供免费试用。<p>感谢您提供的所有反馈!
1作者: peturgeorgievv10 个月前
我讨厌使用那些充满“氛围代码”的东西,或者那些UI/UX/BE(后端)等各种坏掉的软件,所以我决定自己开发一个。<p>这花了我一些时间,因为我是从头开始构建的,采用了一个合适的后端解决方案——NestJS,并使用了Redis、Kafka进行消息传递,以及更多工具来确保它的稳定。<p>我的着陆页是用Next.js构建的,用于SSR(服务器端渲染)/SEO优化。<p>我觉得这正在成为一个最好的工具,可以与Buffer、Hootsuite等巨头竞争。已经有一些付费客户了,他们对它非常满意。<p>我正在构建报告、更多的集成和功能,在我看来,它棒极了,因为它运行良好而且速度快。