1作者: brokeceo77 个月前
我们创建 Chargenda 的初衷是,如今的企业会使用数十种工具——而大多数人都会忘记续订日期、免费试用期和重复发生的费用。Chargenda 将所有信息集中在一处,在续订前发送提醒,并帮助团队削减不必要的开支。
1作者: 2dogsanerd7 个月前
嘿 HN, 我构建这个工具是因为我厌倦了传统 PDF 表格提取工具中出现的“静默失败”。 在我的日常工作中,我需要处理金融和法律文件,像 Camelot 或 Tabula 这样的工具经常会返回看起来合理但列错位或缺少小数点的的数据。在受监管的环境中,你无法承受猜测的风险。 我构建了一个管道,将提取视为一个需要验证的假设: 1. *提取:* 使用 IBM 的 Docling 解析布局并获取结构(Markdown)。 2. *视觉验证:* 截取 PDF 中特定表格区域的屏幕截图。 3. *验证:* 将 Markdown 和屏幕截图都输入到本地 Vision LLM(通过 Ollama 的 Llama 3.2)。 4. *评分:* LLM 比较像素真值与提取的文本,并输出置信度分数 + 审计跟踪。 这种方法在速度(每个表格大约需要 5 秒)和置信度之间做了权衡。它设计为 100% 在本地运行,以保护隐私敏感的文档。 代码库在这里:<a href="https://github.com/2dogsandanerd/validated-table-extractor" rel="nofollow">https://github.com/2dogsandanerd/validated-table-extractor</a> 很想听听你们在 RAG 管道中如何处理数据完整性!
7作者: walrussama7 个月前
我之前有个问题,就是会写日记,但写完之后就再也不看了。所以我想,如果能安排一个东西在未来某个时间发给我(就像时间胶囊一样)应该会很酷。这个想法也受到了 FutureMe 的启发,你可以在那里给自己发未来才会收到的信。
1作者: giuliomagnifico7 个月前
https://euclyd.ai 看起来有点像“PPT公司”。但他们声称其投资人包括 ASML 的前 CEO 和微处理器发明人法金。这款芯片的规格令人印象深刻。 <pre><code>Euclyd 是一家欧洲科技初创公司,致力于为基础 AI 模型(包括大型语言模型)开发超高效的硅基系统。通过重新思考堆栈的每一层——从定制神经处理器到内存架构和系统级设计——Euclyd 大幅降低了 AI 数据中心基础设施的能耗、成本和占地面积。Euclyd 根植于欧洲的工程价值观,致力于构建环保、具有社会责任感且精心打造的 AI 解决方案。公司总部位于荷兰埃因霍温,在加利福尼亚州圣何塞设有办事处。Euclyd 由一支富有远见的工程师团队领导,并由行业传奇人物提供指导和支持,包括 Peter Wennink(ASML 前 CEO)、Federico Faggin(微处理器发明人,Zilog 和 Synaptics 创始人)和 Steven Schuurman(Elastic 创始人)。</code></pre>
1作者: saswatms7 个月前