4作者: SachitRafa23 天前
这是一个我正在构建一段时间的项目,YourMemory 旨在解决智能体记忆问题,它侧重于剔除噪声而非囤积数据。 在当前智能体记忆的现状下,大部分上下文以 MD 文件形式存储,或者通过 RAG 模型提取,这种方式会存储所有信息。这两种解决方案都会导致上下文臃肿,无法优化 token 的使用。 在本系统中,我们只保留内存中的相关数据,并剔除所有不必要的数据。数据的相关性通过多种因素确定,例如回忆率、重要性、类别以及它连接到的记忆链等。这些参数经过微调,以便我们能够兼顾情景记忆和语义记忆。 我们的记忆层以此方式保持大小稳定。你可以将这种基础设施与人脑存储和剔除记忆的方式进行类比。 企业模型非常令人兴奋,因为我们可以从每个用户、智能体和子智能体中提取相关的记忆,并供组织内的任何人使用,从而确保企业级别的记忆优化。
2作者: loverofpizzas23 天前
1作者: utopman23 天前
大家好, 我在消费级硬件上找到了一个设置,它似乎在本地硬件上取得了很好的效果。 - qwen 3.6 q6 - 使用 turboquant turbo3 模式的 llama.cpp 分支,上下文长度为 450K - 多模态支持 本文是一篇 AI 生成的博客文章,算是对“我做了什么以及如何做的”以及结果示例的“报告”。 希望这对一些人有所帮助。 注意:我不太在意这篇文章是否成功,我主要想分享我认为 5090 的一个有趣用法。我让 AI 生成了博客页面,要求它遵守 HN 的“规则”并保持事实性。 它肯定不完美,做得比较仓促,在 265K 上下文长度下没有经过充分测试。请原谅我的懒惰 :)。我现在只是对 5090 上能做的事情感到兴奋。
1作者: jakemanger24 天前
作为一个热爱编程(使用 Vim,并且已经使用了大约 10 年)的人,<p>同时又对 AI 编程工具感到惊叹,并且最近已经开始拥抱它们(例如 Copilot、Claude Code、Codex),<p>我想知道,还有谁没有在使用这些工具?如果还没有,原因是什么?<p>我觉得这已经变得像自动补全或 IntelliSense 一样普遍了。虽然我记得以前人们也很讨厌那些东西。<p>我猜 AI 就像现代版的 IntelliSense + 文档,而且总是针对你正在做的事情,<p>(也许再加上一个永不休息的实习生)