1 分•作者: mooreds•2 天前
返回首页
最新
1 分•作者: mooreds•2 天前
2 分•作者: xinghaohuang•2 天前
Hi HN,
在构建 RAG 代理时,我注意到很多 token 预算都浪费在了格式化开销上(HTML 标签、JSON 结构、空格)。现有的解决方案感觉太笨重了(通常需要 torch/transformers),所以我编写了这个轻量级、零依赖的库来解决这个问题。
它包括上下文打包、PII(个人身份信息)编辑和工具输出压缩等策略。基准测试表明,它可以节省约 15% 的 token,并且延迟开销可以忽略不计(<0.5ms)。
欢迎提问!
30 分•作者: tananaev•2 天前
2 分•作者: doener•2 天前
1 分•作者: ulrischa•2 天前
2 分•作者: austinallegro•2 天前
1 分•作者: robaato•2 天前
1 分•作者: mobrienv•2 天前
我随机浏览了 Claude 代码的 Ralph Wiggum 插件[1],很惊讶地发现我的玩具项目被引用了。既然看起来大家觉得它有点用,我就在这里分享一下……
声明一下,这个仓库本身是用一个简陋的 Ralph Wiggum 循环构建的,所以可能会有一些 AI 生成的“垃圾”。不过它确实能用。¯\_(ツ)_/¯
[https://mikeyobrien.github.io/ralph-orchestrator/](https://mikeyobrien.github.io/ralph-orchestrator/)
[1] [https://github.com/anthropics/claude-code/tree/main/plugins/ralph-wiggum](https://github.com/anthropics/claude-code/tree/main/plugins/ralph-wiggum)
2 分•作者: doener•2 天前
2 分•作者: rolph•2 天前
1 分•作者: TheWiggles•2 天前
2 分•作者: gmays•2 天前
1 分•作者: delduca•2 天前
30 分•作者: ksec•2 天前
36 分•作者: jakelsaunders94•2 天前
1 分•作者: aizk•2 天前
1 分•作者: kartikkumar•2 天前
1 分•作者: Schmiedey•2 天前
2 分•作者: c420•2 天前