2 分•作者: ElliottCrosby•20 天前
返回首页
最新
14 分•作者: bwestergard•20 天前
5 分•作者: tanelpoder•20 天前
48 分•作者: lebovic•20 天前
https://www.theverge.com/report/947575/microsoft-claude-fable-5-restricted-internally
72 分•作者: swolpers•20 天前
1 分•作者: frag•20 天前
4 分•作者: scrlk•20 天前
5 分•作者: Philpax•20 天前
1 分•作者: matt_d•20 天前
1 分•作者: Calishat•20 天前
1 分•作者: gokhan•20 天前
1 分•作者: Brajeshwar•20 天前
1 分•作者: bobbiechen•20 天前
1 分•作者: dmarcos•20 天前
1 分•作者: littlexsparkee•20 天前
3 分•作者: rdrmc•20 天前
我是[某大公司]的一名资深工程师,AI工具无处不在。虽然没有强制要求使用它们,但它们非常方便,大多数人还是会用。<p>AI存在很多社会层面的担忧,但在个人层面,我开始慢慢觉得自己不如以前熟练了。我当然能做更多的事情,但我理解得更少了。“提示-然后-审查”的编码循环(如Claude Code、Codex、Pi、OpenCode、Amp等)根本不像自己动手编写代码那样鼓励精通。当然,你可以争辩说你在“以更高的抽象层次思考”。但当这种抽象失败时会发生什么?因为抽象往往会失败。<p>这种技能的消退不是一个快速的过程。我不是一夜之间就神奇地失去了编码能力。然而,感觉就像生锈一样。慢慢侵蚀支柱,直到它们垮塌。<p>这个工具(目前)需要熟练的手来正确引导。然而,使用这个工具感觉就像它在削弱熟练的手。这种负反馈循环,我发现无论是在软件行业谋生能力方面,还是在对整个软件质量的影响方面,都确实令人担忧。<p>所以,我想问HN(Hacker News社区)。社区是如何保护自己的技能的?尤其是在积极使用AI的情况下。
7 分•作者: nils_spatial•20 天前
大家好,我是 Julius、Jago 和 Nils,我们正在开发 transload (transload.io)。
transload 帮助 LTL(零担)货运公司利用其终端中已安装的安防摄像头测量货物的尺寸。无需将货物通过专门的尺寸测量站,我们可以在货物通过正常装卸流程时自动测量其尺寸。
我们为此搭建了一个 HN 专属的演示网站:https://hn.transload.io/
在 LTL 货运中,尺寸非常重要,因为它会影响定价、货物分类和拖车利用率。如果货物的实际尺寸大于托运人报告的尺寸,承运商可能会少收费用,但仍然占用相同的拖车空间。显而易见的解决方法是测量每一批货物,但在繁忙的货运终端中,这却出奇地困难。专用的尺寸测量系统适用于经过它们的货物,但可能会增加叉车的行驶距离、造成装卸区拥堵,并改变正常的工作流程。实际上,许多终端只测量部分货物。
Jago 通过他家人的 LTL 货运和交叉转运业务,对这个行业非常了解。我们最初并非打算开发货物尺寸测量系统。我们的第一个想法是开发一个人工智能系统,用于优化交叉转运终端内的叉车路线。在与客户接触并与 50 多家货运公司交流后,我们发现叉车路线优化并不是人们反复提及的痛点。货物尺寸才是。
与此同时,我们注意到空间人工智能技术正在快速发展。单目度量深度估计技术取得了显著进步,使得无需昂贵的 LiDAR 传感器,就能从普通摄像头拍摄的视频中准确恢复三维结构。MapAnything (https://github.com/facebookresearch/map-anything) 和 MoGe (https://github.com/microsoft/moge) 就是两个例子。
货运终端也具有一些有利的结构:固定的摄像头、重复的工作流程、条形码扫描时间戳以及已知的布局。几乎每个仓库都装有闭路电视。这让我们想到一个简单的问题:如果我们能利用现有的安防摄像头自动测量货物,并且完全在后台进行,会怎么样?这样,承运商就可以在不改变装卸流程的情况下测量每一批货物。
我们的系统主要有两个步骤:将条形码扫描与视频中的正确对象关联起来,然后估算该对象的真实尺寸。
装卸工人已经在正常工作流程中扫描货物。每次扫描都会为我们提供一个时间戳和一个处理单元 ID。围绕该时间戳,我们分析视频,推断是哪位工人进行了扫描以及他们扫描的是哪批货物。我们曾期望 VLM(视觉语言模型)能处理这个问题;但事实证明它们太不可靠了。相反,我们训练了自己的模型,该模型通过注视、身体姿态和移动等线索进行三维推理。
这种关联步骤至关重要。一个画面中可能包含数十个托盘、几名工人、叉车以及部分隐藏的货物。如果我们把扫描与错误的对象关联起来,测量结果就毫无意义。
一旦我们确定了目标货物,我们就会对其进行分割,并从单目摄像头视图中估算出度量三维边界框。拟合好边界框后,尺寸就一目了然:长度、宽度、高度和体积都直接从中得出。
难点在于如何仅凭一个普通安防摄像头精确地拟合这个边界框。单个二维图像不能直接告诉我们物体的形状或比例,而且许多不同的三维盒子可以解释看起来相似的图像证据。我们利用物体掩码、可见边缘、地面接触、摄像头几何以及终端的约束条件,来找到最符合场景的三维盒子。
我们目前正与几家 LTL 承运商合作。对于其中一位客户,大约 10% 的已检查货物存在尺寸错误。第一个应用场景是收入追回:识别尺寸不符的货物,附上视觉证据,帮助承运商纠正账单或分类。从长远来看,相同的数据可以帮助承运商更好地了解拖车利用率。
LTL 货运是一个进行三维计算机视觉的奇特领域,我们每周都有新的发现。如果您曾从事单目重建、三维物体检测、仓库感知或混乱的真实世界计算机视觉领域的工作,我们非常乐意听取您的意见。关于货物、LTL 终端或技术方法的任何问题也十分欢迎。
4 分•作者: lucamrtl•20 天前
嘿,HN 用户们,如果您想尝试一下,这是代码库:<a href="https://github.com/Kaelio/ktx" rel="nofollow">https://github.com/Kaelio/ktx</a><p>非常期待您的反馈。
133 分•作者: flanged•20 天前
16 分•作者: jacobobryant•20 天前