2作者: xinghaohuang2 天前
Hi HN, 在构建 RAG 代理时,我注意到很多 token 预算都浪费在了格式化开销上(HTML 标签、JSON 结构、空格)。现有的解决方案感觉太笨重了(通常需要 torch/transformers),所以我编写了这个轻量级、零依赖的库来解决这个问题。 它包括上下文打包、PII(个人身份信息)编辑和工具输出压缩等策略。基准测试表明,它可以节省约 15% 的 token,并且延迟开销可以忽略不计(<0.5ms)。 欢迎提问!
1作者: mobrienv2 天前
我随机浏览了 Claude 代码的 Ralph Wiggum 插件[1],很惊讶地发现我的玩具项目被引用了。既然看起来大家觉得它有点用,我就在这里分享一下…… 声明一下,这个仓库本身是用一个简陋的 Ralph Wiggum 循环构建的,所以可能会有一些 AI 生成的“垃圾”。不过它确实能用。¯\_(ツ)_/¯ [https://mikeyobrien.github.io/ralph-orchestrator/](https://mikeyobrien.github.io/ralph-orchestrator/) [1] [https://github.com/anthropics/claude-code/tree/main/plugins/ralph-wiggum](https://github.com/anthropics/claude-code/tree/main/plugins/ralph-wiggum)