1 分•作者: Calishat•20 天前
返回首页
最新
1 分•作者: gokhan•20 天前
1 分•作者: Brajeshwar•20 天前
1 分•作者: bobbiechen•20 天前
1 分•作者: dmarcos•20 天前
1 分•作者: littlexsparkee•20 天前
3 分•作者: rdrmc•20 天前
我是[某大公司]的一名资深工程师,AI工具无处不在。虽然没有强制要求使用它们,但它们非常方便,大多数人还是会用。<p>AI存在很多社会层面的担忧,但在个人层面,我开始慢慢觉得自己不如以前熟练了。我当然能做更多的事情,但我理解得更少了。“提示-然后-审查”的编码循环(如Claude Code、Codex、Pi、OpenCode、Amp等)根本不像自己动手编写代码那样鼓励精通。当然,你可以争辩说你在“以更高的抽象层次思考”。但当这种抽象失败时会发生什么?因为抽象往往会失败。<p>这种技能的消退不是一个快速的过程。我不是一夜之间就神奇地失去了编码能力。然而,感觉就像生锈一样。慢慢侵蚀支柱,直到它们垮塌。<p>这个工具(目前)需要熟练的手来正确引导。然而,使用这个工具感觉就像它在削弱熟练的手。这种负反馈循环,我发现无论是在软件行业谋生能力方面,还是在对整个软件质量的影响方面,都确实令人担忧。<p>所以,我想问HN(Hacker News社区)。社区是如何保护自己的技能的?尤其是在积极使用AI的情况下。
7 分•作者: nils_spatial•20 天前
大家好,我是 Julius、Jago 和 Nils,我们正在开发 transload (transload.io)。
transload 帮助 LTL(零担)货运公司利用其终端中已安装的安防摄像头测量货物的尺寸。无需将货物通过专门的尺寸测量站,我们可以在货物通过正常装卸流程时自动测量其尺寸。
我们为此搭建了一个 HN 专属的演示网站:https://hn.transload.io/
在 LTL 货运中,尺寸非常重要,因为它会影响定价、货物分类和拖车利用率。如果货物的实际尺寸大于托运人报告的尺寸,承运商可能会少收费用,但仍然占用相同的拖车空间。显而易见的解决方法是测量每一批货物,但在繁忙的货运终端中,这却出奇地困难。专用的尺寸测量系统适用于经过它们的货物,但可能会增加叉车的行驶距离、造成装卸区拥堵,并改变正常的工作流程。实际上,许多终端只测量部分货物。
Jago 通过他家人的 LTL 货运和交叉转运业务,对这个行业非常了解。我们最初并非打算开发货物尺寸测量系统。我们的第一个想法是开发一个人工智能系统,用于优化交叉转运终端内的叉车路线。在与客户接触并与 50 多家货运公司交流后,我们发现叉车路线优化并不是人们反复提及的痛点。货物尺寸才是。
与此同时,我们注意到空间人工智能技术正在快速发展。单目度量深度估计技术取得了显著进步,使得无需昂贵的 LiDAR 传感器,就能从普通摄像头拍摄的视频中准确恢复三维结构。MapAnything (https://github.com/facebookresearch/map-anything) 和 MoGe (https://github.com/microsoft/moge) 就是两个例子。
货运终端也具有一些有利的结构:固定的摄像头、重复的工作流程、条形码扫描时间戳以及已知的布局。几乎每个仓库都装有闭路电视。这让我们想到一个简单的问题:如果我们能利用现有的安防摄像头自动测量货物,并且完全在后台进行,会怎么样?这样,承运商就可以在不改变装卸流程的情况下测量每一批货物。
我们的系统主要有两个步骤:将条形码扫描与视频中的正确对象关联起来,然后估算该对象的真实尺寸。
装卸工人已经在正常工作流程中扫描货物。每次扫描都会为我们提供一个时间戳和一个处理单元 ID。围绕该时间戳,我们分析视频,推断是哪位工人进行了扫描以及他们扫描的是哪批货物。我们曾期望 VLM(视觉语言模型)能处理这个问题;但事实证明它们太不可靠了。相反,我们训练了自己的模型,该模型通过注视、身体姿态和移动等线索进行三维推理。
这种关联步骤至关重要。一个画面中可能包含数十个托盘、几名工人、叉车以及部分隐藏的货物。如果我们把扫描与错误的对象关联起来,测量结果就毫无意义。
一旦我们确定了目标货物,我们就会对其进行分割,并从单目摄像头视图中估算出度量三维边界框。拟合好边界框后,尺寸就一目了然:长度、宽度、高度和体积都直接从中得出。
难点在于如何仅凭一个普通安防摄像头精确地拟合这个边界框。单个二维图像不能直接告诉我们物体的形状或比例,而且许多不同的三维盒子可以解释看起来相似的图像证据。我们利用物体掩码、可见边缘、地面接触、摄像头几何以及终端的约束条件,来找到最符合场景的三维盒子。
我们目前正与几家 LTL 承运商合作。对于其中一位客户,大约 10% 的已检查货物存在尺寸错误。第一个应用场景是收入追回:识别尺寸不符的货物,附上视觉证据,帮助承运商纠正账单或分类。从长远来看,相同的数据可以帮助承运商更好地了解拖车利用率。
LTL 货运是一个进行三维计算机视觉的奇特领域,我们每周都有新的发现。如果您曾从事单目重建、三维物体检测、仓库感知或混乱的真实世界计算机视觉领域的工作,我们非常乐意听取您的意见。关于货物、LTL 终端或技术方法的任何问题也十分欢迎。
4 分•作者: lucamrtl•20 天前
嘿,HN 用户们,如果您想尝试一下,这是代码库:<a href="https://github.com/Kaelio/ktx" rel="nofollow">https://github.com/Kaelio/ktx</a><p>非常期待您的反馈。
133 分•作者: flanged•20 天前
16 分•作者: jacobobryant•20 天前
3 分•作者: npip99•20 天前
11 分•作者: rough-sea•20 天前
在 Deno,我们越来越多地使用 OpenClaw 和其他代理来解决 Deno Deploy 中的生产问题——当 PagerDuty 警报触发时,代理会开始研究原因并进行修复。
为了做到这一点,代理需要访问真实的生产系统——Postgres、Kubernetes、GCP、ClickHouse、GitHub 等。但至少可以说这是危险的——我们希望破坏性操作能够由其他 LLM 进行审查,由人类批准,并进行适当的记录。
Claw Patrol 通过 WireGuard 或 Tailscale 终止 TCP 连接,然后解析应用程序协议(例如 HTTP、Postgres、SSH)以应用允许您拒绝/允许请求的规则。
有一些项目作为代理位于代理前面,用于注入密钥或应用各种安全措施,但没有一个能满足我们的需求(LLM 网关、MCP 代理、沙箱),特别是处理低级协议或处理复杂的真实世界情况,例如通过 Kubernetes 隧道传输 Postgres。
使用 Go 编写,使用 HCL 配置,MIT 许可。乐意回答任何问题。
2 分•作者: yv1ing•20 天前
专为授权渗透测试和漏洞研究设计的 AI 原生红队工作台,配备专业代理、沙盒化工具、证据记录和可回放的时间线。
90 分•作者: doener•20 天前
1 分•作者: cli-market•20 天前
1 分•作者: vedhant•20 天前
我主要使用 Claude 进行代码编写,有时也会使用 Cursor。我会不断地给出提示,代理则会持续地进行编码。但 Git 提交是在有意义的更改之后才进行的,最少也是为一个小型功能提交一次。我会自己检查关键代码,而且每当代理弄乱代码时,我都需要它将更改回滚到它之前所做的某个更改(大多数时候是回滚到上一个提示)。这些微小的更改通常不会被提交到 Git。这种回滚让我很头疼,而且提示代理回滚最后一次更改也曾出过问题(它曾几次执行了 `git revert`)。我想知道是否有任何合理的方法来解决这个问题,以免我把自己逼疯……
1 分•作者: katyadrozd•20 天前
1 分•作者: randycupertino•20 天前
1 分•作者: wslh•20 天前