1 分•作者: edent•7 个月前
返回首页
最新
1 分•作者: cat-whisperer•7 个月前
1 分•作者: lioeters•7 个月前
1 分•作者: todsacerdoti•7 个月前
1 分•作者: stephantul•7 个月前
嘿,HN,
我一直在研究如何加速检索管道,最终构建了一个我称之为 PyNIFE(近乎免推理的嵌入)的东西。
这个想法很简单:训练一个静态嵌入模型,使其与更大的“教师”模型完全对齐,这样你就可以几乎完全跳过昂贵的推理。在实践中,这意味着在 CPU 上生成嵌入的速度提高了 400-900 倍,同时仍然使用相同的向量索引,并与你现有的设置保持兼容。
你甚至可以混合使用:在需要准确性时使用原始模型,而 PyNIFE 用于超快速查找或代理循环。
目前还处于早期阶段,我非常希望收到反馈,特别是关于它可能在哪里失效、你会在哪些类型的工作负载上测试它,以及关于更好的评估或可视化的任何想法。
代码库:<a href="https://github.com/stephantul/pynife" rel="nofollow">https://github.com/stephantul/pynife</a>
2 分•作者: dropbox_miner•7 个月前
2 分•作者: MilnerRoute•7 个月前
1 分•作者: Austin_Conlon•7 个月前
1 分•作者: empyreanite•7 个月前
1 分•作者: ashishgupta2209•7 个月前
1 分•作者: DanexCodr•7 个月前
1 分•作者: nsoonhui•7 个月前
21 分•作者: hereme888•7 个月前
17 分•作者: simonw•7 个月前
1 分•作者: pabs3•7 个月前
1 分•作者: jnord•7 个月前
1 分•作者: walterbell•7 个月前
4 分•作者: eloisius•7 个月前
1 分•作者: johnaldenboyd•7 个月前
6 分•作者: nill0•7 个月前