1作者: paulpauper9 个月前
2作者: gargiulof9 个月前
我一直在研究一种压缩算法,用于在大型集合中快速随机访问单个字符串。<p>这个问题是在处理大型内存数据库列(电子邮件、URL、产品标题等)时出现的,其中低延迟的点查询至关重要。对于短字符串,基于 LZ77 的压缩器表现不佳。块压缩有所帮助,但块大小需要在压缩比和访问速度之间进行权衡。<p>一些现有的方案:<p>- BPE:压缩比好,但速度慢且占用内存<p>- FSST(在此处讨论:<a href="https:&#x2F;&#x2F;news.ycombinator.com&#x2F;item?id=41489047">https:&#x2F;&#x2F;news.ycombinator.com&#x2F;item?id=41489047</a>):速度非常快,但压缩效果较弱<p>这个解决方案提供了一个有趣的平衡(更多细节见论文):<p>- 压缩比:与 BPE 类似<p>- 压缩速度:100–200 MiB&#x2F;s<p>- 解压缩速度:6–7 GiB&#x2F;s<p>我很乐意听取您的想法——无论是您认为这可能有所帮助的工作负载,API 改进的建议,还是仅仅是一般的讨论。 随时欢迎在这里或通过电子邮件交流。<p>---<p>资源:<p>- 论文:<a href="https:&#x2F;&#x2F;arxiv.org&#x2F;pdf&#x2F;2508.02280" rel="nofollow">https:&#x2F;&#x2F;arxiv.org&#x2F;pdf&#x2F;2508.02280</a><p>- Rust 实现:<a href="https:&#x2F;&#x2F;github.com&#x2F;gargiulofrancesco&#x2F;onpair_rs" rel="nofollow">https:&#x2F;&#x2F;github.com&#x2F;gargiulofrancesco&#x2F;onpair_rs</a><p>- C++ 实现:<a href="https:&#x2F;&#x2F;github.com&#x2F;gargiulofrancesco&#x2F;onpair_cpp" rel="nofollow">https:&#x2F;&#x2F;github.com&#x2F;gargiulofrancesco&#x2F;onpair_cpp</a>
2作者: jgiraldo299 个月前
大家好,经过一段时间的开发,我很高兴这个项目终于可以面世了。我喜欢 Tor,但我认为 Tor 最大的问题在于它的节点都是陌生人,这本身就对用户提出了某种程度的要求,即完全信任陌生人。<p>因此,我决定构建这个受洋葱路由启发而来的私有网络。与其它公共网络不同,GiralNet 并非用于匿名连接陌生人。它专为希望拥有隐私,同时又需要一定程度信任的小团队或小组而设计。它假设运行网络节点的都是已知且可验证的人。这为团队提供了一种创建自己私密且安全网络的方式,基础设施可控,节点背后的人员也需要负责。我们的目标是在不依赖大型匿名公共网络的情况下提供隐私保护。<p>从技术细节上讲,它是一个 SOCKS5 代理,通过一系列其他计算机路由互联网流量。它通过将您的数据封装在多层加密中来实现这一点,就像洋葱路由器一样。路径中的每台计算机都会解开一层加密,以找到下一个目的地,但永远不知道完整的路径。这使得任何一方都难以同时看到流量的来源和去向。<p>我很乐意回答您可能有的任何问题,谢谢。