最新

嘿 HN，我构建这个工具是因为我厌倦了传统 PDF 表格提取工具中出现的“静默失败”。在我的日常工作中，我需要处理金融和法律文件，像 Camelot 或 Tabula 这样的工具经常会返回看起来合理但列错位或缺少小数点的的数据。在受监管的环境中，你无法承受猜测的风险。我构建了一个管道，将提取视为一个需要验证的假设： 1. *提取：* 使用 IBM 的 Docling 解析布局并获取结构（Markdown）。 2. *视觉验证：* 截取 PDF 中特定表格区域的屏幕截图。 3. *验证：* 将 Markdown 和屏幕截图都输入到本地 Vision LLM（通过 Ollama 的 Llama 3.2）。 4. *评分：* LLM 比较像素真值与提取的文本，并输出置信度分数 + 审计跟踪。这种方法在速度（每个表格大约需要 5 秒）和置信度之间做了权衡。它设计为 100% 在本地运行，以保护隐私敏感的文档。代码库在这里：<a href="https://github.com/2dogsandanerd/validated-table-extractor" rel="nofollow">https://github.com/2dogsandanerd/validated-table-extractor</a> 很想听听你们在 RAG 管道中如何处理数据完整性！

这是有史以来最棒的机内特效吗？ [视频]

1 分•作者: chii•7 个月前

寄生式人工智能的崛起

1 分•作者: dustingetz•7 个月前

高流量服务的 Golang 优化

1 分•作者: todsacerdoti•7 个月前

高吞吐量服务的 Golang 优化

1 分•作者: der_gopher•7 个月前

糟糕的染发

2 分•作者: mpweiher•7 个月前

圣诞的气味：芳香植物、记忆与庆祝的生态学

1 分•作者: dnetesn•7 个月前

现实存在，无需观察者？呸！

1 分•作者: dnetesn•7 个月前

梵蒂冈将一个世纪以来一直保管的神圣文物归还给原住民

1 分•作者: sipofwater•7 个月前

上一页 1...3027 3028 3029 3030 3031...5487 下一页