7 分•作者: bbx•3 天前
返回首页
一周热榜
7 分•作者: williamhaw•3 天前
大家好,我是 Artie 的一名工程师,我们做实时数据复制。<p>我们当时在添加 MotherDuck 作为目标,第一个版本直接使用了 DuckDB 的 Go 驱动。它在我的机器上运行得很好……直到我们把它接入到我们的 Transfer 服务中(<a href="https://github.com/artie-labs/transfer" rel="nofollow">https://github.com/artie-labs/transfer</a>)。<p>由于该驱动需要 CGO,我们的 amd64 和 arm64 交叉编译开始失败,我们失去了易于使用的静态二进制文件,而且我们的 Docker 镜像不得不引入 C 工具链和系统库,仅仅是为了支持一个依赖项。我们尝试将 CGO 部分隔离到一个单独的模块中,但这仍然导致了 CI 失败,并迫使我们重写了构建流程的很大一部分。在那时,很明显我们不希望 CGO 出现在我们的主要服务中。<p>所以我构建了 ducktape:一个微小的独立微服务,它通过 HTTP/2 流封装了 DuckDB 的 Appender API。客户端通过 HTTP/2 流式传输 NDJSON,而 ducktape 则直接在另一端追加到 DuckDB 中。主代码库中没有 CGO,我们保持了跨平台、纯 Go 的构建方式。<p>在基准测试中,开销出人意料地低:通过 HTTP/2 约为 757 MiB/秒,而进程内约为 848 MiB/秒——大约是原生性能的 90%,但这是通过网络实现的。<p>ducktape 是开源的,并获得了 MIT 许可:<a href="https://github.com/artie-labs/ducktape" rel="nofollow">https://github.com/artie-labs/ducktape</a><p>我很乐意收到反馈,特别是如果您以不同的方式解决了 CGO 隔离问题,或者有想法可以榨取更多性能!
6 分•作者: mitchbob•3 天前
6 分•作者: ankuranand•5 天前
6 分•作者: geekman7473•4 天前
6 分•作者: sidmanchkanti21•大约 21 小时前
嗨 HN,我们是 Pulse 的联合创始人 Sid 和 Ritvik。Pulse 是一个文档提取系统,用于创建 LLM 预处理文本。我们构建 Pulse 是因为我们意识到,尽管现代视觉语言模型在生成看似合理的文本方面表现出色,但这使得它们在大规模 OCR 和数据摄取方面存在风险。
当我们开始研究文档提取时,我们假设了当今许多团队都在做的事情:基础模型正在快速改进,多模态系统似乎可以很好地读取文档,对于小型或干净的输入,这种假设通常是成立的。一旦我们开始批量处理真实文档,局限性就显现出来了。长篇 PDF、密集的表格、混合布局、低保真扫描以及财务或运营数据暴露了微妙、难以检测且纠正成本高昂的错误。输出结果通常看起来合理,但却包含小的但有意义的错误,尤其是在表格和数字字段中。
从那时起,我们的大部分工作都是应用研究。我们对复杂文档进行受控评估,微调视觉模型,并构建了真实情况真正重要的标记数据集。我们的团队曾多次熬夜手动注释页面,在表格周围绘制边界框,逐点标记图表,或者争论一个数字是无法辨认还是仅仅扫描不佳。这个过程塑造了我们的直觉,远远超过了基准测试。
有一点很快变得清晰。核心挑战不在于提取本身,而在于置信度。视觉语言模型将文档图像嵌入到高维表示中,这些表示针对语义理解而不是精确转录进行了优化。这个过程本质上是有损的。当出现不确定性时,模型倾向于使用已学习的先验来解决它,而不是揭示歧义。这种行为在消费者环境中可能有所帮助。但在生产流水线中,它会产生无法很好扩展的验证问题。
Pulse 的出现源于试图通过系统设计而非仅仅通过提示来解决这一差距。该系统没有将文档理解视为单个生成步骤,而是将布局分析与语言建模分开。文档被规范化为结构化表示,在进行模式映射之前保留层次结构和表格。提取受到预先定义的模式的约束,并且提取的值与源位置相关联,因此可以检查不确定性,而不是将其猜测掉。实际上,这产生了一种混合方法,结合了传统的计算机视觉技术、布局模型和视觉语言模型,因为没有单一方法可以单独可靠地处理这些情况。
我们有意分享了一些文档,这些文档反映了促使这项工作产生的输入类型。这些是我们在通用 OCR 或基于 VLM 的流水线中看到问题的案例的代表。
这是一个财务 10K 文件:
[https://platform.runpulse.com/dashboard/examples/example1](https://platform.runpulse.com/dashboard/examples/example1)
这是一份报纸:
[https://platform.runpulse.com/dashboard/examples/example2](https://platform.runpulse.com/dashboard/examples/example2)
这是一个租金清单:
[https://platform.runpulse.com/dashboard/examples/example3](https://platform.runpulse.com/dashboard/examples/example3)
Pulse 并非完美无缺,尤其是在高度退化的扫描或不常见的笔迹上,并且仍有改进的空间。目标不是完全消除错误,而是使其可见、可审计且更易于推理。
Pulse 通过基于使用的 API 和平台访问提供。您可以在此处试用,并在此处访问 API 文档。
演示链接:[https://video.runpulse.com/video/pulse-platform-walkthrough-69f9](https://video.runpulse.com/video/pulse-platform-walkthrough-69f9)
我们有兴趣听取这里其他人如何评估文档提取的正确性,您在实践中看到了哪些失败模式,以及您依赖哪些信号来决定是否可以信任输出。我们将随时回答问题,并很乐意运行其他文档,如果人们想分享示例的话。
6 分•作者: ibobev•6 天前
6 分•作者: timatping•大约 21 小时前
嘿,HN!我们创建了 DNS 目录(<a href="https://dnsdirectory.com" rel="nofollow">https://dnsdirectory.com</a>),这是一个免费、可搜索的公共 DNS 服务器数据库,每 10 分钟进行一次实时监控。
我们最初是为了一个代理指纹识别/网络抓取项目,需要找到一份全球运营商使用的 DNS 服务器的最新列表,但我们惊讶地发现竟然没有这样的数据库,所以我们在一次内部黑客马拉松中自己动手构建了它。
我们正在添加更多功能,但目前我们已经实现了:
* 每 10 分钟测试 77000 多个服务器
* 允许按正常运行时间、位置、安全功能(广告拦截、恶意软件防护、DNSSEC)进行筛选
* 显示 IPv6 支持、任播等信息
* 显示所有历史测试信息
我们没有将该网站货币化的计划,它将保持免费,以便作为公共资源使用。
我很乐意听取大家对改进网站的建议。它目前可以运行,但某些方面,例如内容过滤检测,还不够完善,我们希望在亚洲和美国增加测试节点,以获得更好的覆盖范围,因为目前我们只从阿姆斯特丹进行测试。
如果你想添加网站上没有的 DNS 服务器,可以通过表格添加。如果你是一个大型组织,需要添加大量服务器,可以通过 support@dnsdirectory.com 给我发邮件,我们会导入它们。
谢谢!
6 分•作者: fnimick•4 天前
以下是我收到的关于如何适应以惊人速度发展的 AI 驱动开发的建议——甚至达到 AI 工具编写和发布项目,而“操作员”甚至不了解这些语言的程度。 你如何在一个工作流程中建立信心?例如,一个团队的 AI 代理进行开发,另一个团队的 AI 代理进行代码审查和测试,然后直接发布,而没有人类验证实施?
我听说初创公司的开发人员每天部署 10,000 到 30,000 多行代码,并且现在一个开发人员应该能够在不到一个月的时间内构建通常需要工程师数年才能完成的完整产品。这现实吗? 你如何学习像这样操作?
6 分•作者: MrSkelter•2 天前
6 分•作者: LorenDB•大约 7 小时前
6 分•作者: justintorre75•3 天前
我制作了一个工具,可以同时向 GPT、Claude、Gemini、Llama、Grok 和 DeepSeek 呈现定制的电车难题,并实时流式传输它们的伦理推理。<p>一些有趣的发现:
- 模型在经典困境上出人意料地存在分歧。
- 模型会保护它们的创造者(萨姆·阿尔特曼 vs 达里奥·阿莫迪)。
- 即使与自身相比,罪犯的价值也不平等。<p>试用一下:<a href="https://aitrolleyproblem.com" rel="nofollow">https://aitrolleyproblem.com</a>
6 分•作者: mfrw•2 天前
你对来年有什么预测吗?
6 分•作者: VladVladikoff•5 天前
我正在寻找一款价格实惠/便宜的智能手表,可以进行修改。理想情况下,我只想设置自定义的图片背景,并锁定/禁用所有其他智能功能,特别是游戏或类似的东西。最好足够便宜,这样当我的孩子不可避免地弄丢或弄坏它时,我也不至于为浪费的钱而心疼。
5 分•作者: upmostly•7 天前
5 分•作者: suhaspatil101•大约 17 小时前
大多数关于创业的建议听起来都很有道理。“找到一个问题。”“解决你自己的痛点。”“打造人们需要的东西。”
我照做了,但仍然看到包括我在内的聪明创始人花了几个月的时间去打造一些悄无声息地失败的东西。
这种矛盾让我很困扰,于是我开始深入研究。我开始阅读失败的案例分析、在Product Hunt上夭折的产品发布、被废弃的GitHub代码库,以及Hacker News上人们解释他们为什么放弃一个想法的冗长讨论。
过了一段时间,一个模式出现了。问题不在于人们缺乏想法,而在于我们用讲故事的逻辑而不是生存的逻辑来评估想法。
我们选择的想法听起来有趣,感觉有野心,或者在推介中看起来不错,但当它们遇到现实世界的行为时,就会崩溃。
扼杀大多数想法的不是竞争或执行力,而是它们没有替代任何紧急的事情。
它们没有映射到现有的习惯、重复发生的成本,或者人们已经在使用的痛苦的变通方法。
当你问一些简单的问题,比如谁在付费,他们采用这个之后会停止做什么,以及为什么是现在,大多数想法很快就会瓦解。
为了不再重复这个错误,我开始把想法写成假设,而不是灵感。
每个想法都必须经受住几个令人不舒服的问题:它取代了什么现有的行为,什么会在前三十天内扼杀它,以及什么样最小的实验可以证明或反驳需求。
大多数想法立即失败。少数想法比预期的存活时间更长。
随着时间的推移,这变成了一个我用来避免在弱想法上浪费几个月的私人数据库。它不是“好想法”的集合。
它是一个记录了在残酷筛选中幸存下来的想法,以及许多没有幸存下来的想法。最终,我将其整理成其他人可以浏览的东西,现在被称为startupideasdbcom(谷歌一下),主要是因为我一直希望早点有类似的东西。
如果你在选择要构建什么时遇到困难,或者厌倦了那些悄无声息地消亡的巧妙想法,这可能会为你节省一些时间。
如果你不同意这个框架,我真的很有兴趣知道它在哪里失效,Hacker News通常比其他任何地方都能更快地发现缺陷。
5 分•作者: ideavo•3 天前
你如何判断你想要或正在进行的项目是否值得投入时间、精力和金钱?这里说的不是你周末就能完成的副业项目,而是那些你希望从中盈利,甚至希望面向中等或大型受众(每天/每周用户超过100人)的项目。
我在 Reddit 上看到很多帖子,人们都在寻求验证。所以我为此创建了一个社区驱动的平台,我只附上链接:https://ideavo.tripivo.co.in
但我的问题仍然是,如果你没有获得任何验证,为什么要冒这个险去做呢?
5 分•作者: zdw•6 天前
5 分•作者: toomuchtodo•6 天前
5 分•作者: h100ker•大约 13 小时前
我正在打造一款很棒的产品,目前有几十个早期用户。我选择的切入点是针对拍卖结果进行竞猜,因为我深入参与了汽车、艺术品、手表等领域,无论是线上还是线下都有广泛的人脉。我了解如何从这个细分市场打造出色的产品,并且已经证明在早期用户中找到了产品市场契合度(PMF)。但是,像这样的想法,应该去哪里寻找投资人呢?我相信,PolyBets.fun 专注于这些人们每天都会密切关注的领域,可以在更短的时间内超越 Kalshi。无论他们是否买得起,都会关注这些市场,以获取对其个人投资组合策略的洞察。<p>我不想再次申请 YC 了。我申请了 7 次,有或没有联合创始人,有或没有推荐人,并且尝试了多个不同的想法。我已经对 YC 失去了兴趣,所以现在我只想寻找相信产品、相信创始人(我)和相信垂直领域的人。我们正在寻求大量资金,主要目的是为了克服所有的监管障碍(CFTC DCM),这需要大量的启动资金。