1作者: __padding6 个月前
前段时间,我和一位同事聊天,他们想对 PCAP 文件运行一些 SQL 查询——按源 IP 聚合,诸如此类。他们搜索了一番,找到了 PacketQ(仅限 DNS/ICMP),Apache Drill 的 PCAP 支持(仅限外层头部),DuckDB 有一个 PCAP 读取器社区扩展(情况相同,仅限于外层头部)。你总是可以用 scapy 或 gopacket 编写一次性脚本,但这很快就会过时。 我们经常处理隧道流量,这些工具似乎在这方面功能并不丰富,例如,对于 VXLAN,每个工具都只显示 UDP/4789,而不是封装的数据包。 所以,作为一个有点失控的周末项目,我构建了他们所要求的。协议层变成表,你用 SQL 查询,它会解析隧道: ```sql -- VXLAN 隧道内的流量 SELECT ip4_to_string(src_ip) as src, ip4_to_string(dst_ip) as dst, COUNT(*) FROM ipv4 WHERE tunnel_type = 'vxlan' GROUP BY 1, 2; -- 流量最多的主机 SELECT ip4_to_string(src_ip) as src, SUM(total_length) as bytes FROM ipv4 GROUP BY 1 ORDER BY bytes DESC LIMIT 10; ``` 它还处理 TLS 解密 (SSLKEYLOGFILE)、HTTP/2 帧解析、GRE/MPLS/GTP,导出到 Parquet,以及直接从 S3 查询。 使用 Rust 基于 Apache Arrow 和 DataFusion 构建。 [https://github.com/mtottenh/pcapsql](https://github.com/mtottenh/pcapsql)
1作者: afavour6 个月前
Grok 按需生成未成年人色情图像,这违反了美国法律。Grok 账号甚至为此“道歉”:<p>https://x.com/grok/status/2006525486021705785<p>但我在主流媒体上几乎没看到相关报道,这里也没有讨论。这是怎么回事?难道有帖子被屏蔽了?这感觉是个大新闻,但我看到的信息却少得让我有点困惑。
9作者: kalenvale6 个月前
我一直在研究“物理预言机问题”(即实物商品的去信任化交易)的解决方案,并且刚刚发布了完整的 Alpha 版本实现。 核心论点:现有的去中心化市场依赖于声誉,这不可避免地会导致中心化。Dealta 用基于纳什均衡的机制取代了声誉。我们使用质押的、伪随机选择的“经纪人”来物理验证商品。该协议通过严格的收益矩阵确保诚实是所有参与者的主导策略。它主要用于中高价值商品的交易。没有人希望收到一台电脑,却得到一箱石头。 我们正在发布的内容:一个定制的 Layer-1 区块链堆栈。 全节点:实现混合共识(PoW + PBFT),实现即时最终性。 集成钱包:为自定义交易操作码提供原生密钥管理和交易构建功能。 数据库管理:针对交易状态和争议证据的自定义索引。 该系统目前处于 Alpha 阶段。我正在寻求关于协议设计、节点架构和合作者的反馈。 代码需要润色,如果大家喜欢这个项目,我会进行完善。 但是,该项目可以运行,如果大家对该项目感兴趣,将会启动一个测试网。 自述文件也将更新。目前,它们提供了一个关于如何构建项目的简单指南。 欢迎发送电子邮件。您可以在我的个人资料或论文中找到我的联系方式。
3作者: matthewshere6 个月前
我构建这个工具是因为我经常需要从 PDF 文件中提取干净的 Markdown 文本,用于写作、文档编写和大型语言模型(LLM)工作流程。<p>现有的工具大多要么将所有内容都扁平化为纯文本,要么完全依赖 OCR 技术。我希望得到一个能够保留结构,并且真正可在 Markdown 中使用的工具。<p>欢迎提供反馈。
5作者: EvaWorld96 个月前
Hello HN, 我是 Joseph,一个独立开发者。我开发 CustomPaste 是因为我厌倦了标准剪贴板工具提供的二元选择:要么保留所有杂乱的格式(背景颜色、超大字体),要么将所有内容简化为纯文本。 我们都知道 Ctrl+Shift+V(粘贴为纯文本),但它通常具有破坏性,会删除超链接、粗体和列表,而我通常只想规范化字体(例如,强制使用 Arial 11pt)或删除背景颜色。 我想要一个工具,让我“精确地删除我想要的,并保留我想要的。” 解决方案:该应用程序不是提供单一的“粘贴”行为,而是允许您创建可重复使用的“配方”来精确定义文本在编辑器中的呈现方式。它会拦截剪贴板,在本地处理结构,并根据您的规则进行转换。 它提供了对以下内容的精细控制: * 智能保留:您可以删除或设置特定的字体系列和大小,但专门保留粗体、斜体和超链接。 * 结构:您可以保留表格,同时删除其中的图像。 * 数据清理:它可以立即清除重复行,按字母顺序对列表进行排序,或删除多余的空行。 * 文本修复:它可以清理 AI 生成的瑕疵(如“智能引号”或破折号),并强制执行大小写(标题大小写、句子大小写)。 隐私和定价:该应用程序 100% 在您的机器上本地运行,没有云处理,也没有数据收集。它是一次性购买(终身许可证),而不是订阅。提供免费试用(前 100 次粘贴),以便您可以测试它是否适合您的工作流程。 我很乐意听取您对“配方”方法的反馈,或者您在粘贴文本时遇到的任何其他边缘情况!