1 分•作者: prashar32•21 天前
返回首页
最新
1 分•作者: m-hodges•21 天前
22 分•作者: theanonymousone•21 天前
4 分•作者: j1000•21 天前
例如:WhatsApp 还是《古惑狼》(1996)?
10 分•作者: febin•21 天前
46 分•作者: lizhang•22 天前
希望您喜欢
2 分•作者: sentacraft•22 天前
1 分•作者: felix_myuk•22 天前
在过去的几个月里,我一直在构建计算机使用代理(computer-use agents, CUA)的原型,并遇到了一个反复出现的问题:许多代理应该能够使用的网站(常见的SaaS仪表板、零售网站、报纸等)会将其识别为非人类而阻止访问。问题在于,这总是会导致更长的执行时间,因为代理不知道何时放弃,而是在循环中运行直到强制超时,或者更糟的是,它会返回错误信息(hallucinations)。这对于需要大量并行研究的群体项目尤其糟糕,因为这些项目一直存在40%-60%的阻止率。
因此,我决定构建一个探测脚本:一个由Chrome控制的浏览器(匹配真实CUA设置的指纹),探测互联网上URL的阻止机制,并根据页面是否加载或哪个WAF供应商介入来标记每个URL为绿色/红色(在某些情况下,会使用CUA线束来提高精度)。结果是Guestlist——一个Python API,允许你在将代理发送到URL之前,检查该URL是否可以与之交互。
当然,这个领域有一些工具可以帮助你掩盖你的代理,使其看起来更像“人类”,并且效果很好,但我认为除了这些工具之外,拥有这样一个工具可以在大型项目中提高一致性。
1 分•作者: peppve•22 天前
1 分•作者: sayyadirfanali•22 天前
1 分•作者: speckx•22 天前
1 分•作者: mastabadtomm•22 天前
经过近三年的开发,Kronotop 的首个开发者预览版现已发布。
Kronotop 是一个构建在 FoundationDB 之上的分布式多模型数据库。
我们的口号是:一次事务,多种模型。
文档、有序键值数据和其他模型可以在同一个严格可串行化的事务中参与,甚至跨命名空间。
我非常期待您的反馈。
1 分•作者: lucas127128•22 天前
better-event 是一个具有超强类型安全的事件发射器。
1 分•作者: speckx•22 天前
1 分•作者: wagnermb•22 天前
1 分•作者: PaulHoule•22 天前
1 分•作者: tcfhgj•22 天前
2 分•作者: franze•22 天前
23 分•作者: fkilaiwi•22 天前
各位 HN 的朋友,我们是 Faisal 和 Ahmad,来自 Intuned (<a href="https://intunedhq.com">https://intunedhq.com</a>)。我们正在构建一个用于创建、部署和维护浏览器自动化的平台。
客户主要使用 Intuned AI 代理来自动化那些没有提供 API 的网站。常见的用例包括抓取数据、提取报告和提交表单。当网站发生变化时,我们的代理还能帮助自动修复自动化流程。
在 Intuned 上,浏览器自动化是由 AI 代理创建并以“代码”形式运行的。我们的基础设施会捕获每次运行的上下文,使我们的代理能够调试和维护底层代码,从而确保自动化流程长期有效。这样,我们就能提供代码的可靠性、速度和成本效益,而无需编写和维护代码的繁琐过程。
以下是演示如何在 Intuned 上构建爬虫的视频:<a href="https://youtu.be/ruZP73bK4FU">https://youtu.be/ruZP73bK4FU</a>
以下是演示如何使用 AI 来维护项目的视频:<a href="https://youtu.be/e4R4hLdHBro">https://youtu.be/e4R4hLdHBro</a>
背景故事:我们最初被 YC 录取是为了一个完全不同的想法。在 YC 期间,由于 Faisal 在 UiPath 的工作经历,许多同期学员询问我们 RPA 工具是否可以通过自动化无 API 的网站来弥补他们产品中的 API 缺失。到了需要调整方向的时候,我们回访了那些创始人,深入了解了他们的问题。(此处 RPA 指的是使用 UI 自动化来完成非测试任务)
我们发现,浏览器自动化中真正棘手的问题是维护。网站会变化,选择器会失效,故障的复现和修复过程可能非常痛苦。因此,在 2024 年初,我们决定与一些客户一起着手解决这个问题。经过大量的迭代,我们才最终确定了目前以代码为中心的方法。
工作原理:Intuned 是深度集成的基础设施和代理。
在基础设施方面,Intuned 是一个托管的浏览器自动化代码运行时。项目通常是基于 Playwright 的 TypeScript 或 Python。用户可以直接在我们的在线 IDE 中编写代码,或者将工作交给代理。无论哪种方式,一旦部署,平台都会在独立的机器中运行每个项目,并处理身份验证/会话重用、调度、批量执行、并发、可观测性以及运行浏览器代码的其他配套功能。
在代理方面,我们花了几个迭代才达到目前的方法。最初的尝试是僵化的流程:收集需求,检查网站,生成代码,然后尝试修补任何出错的地方。这在纸面上看起来不错,但真实的网站太复杂了,无法遵循固定的路径。去年年底,我们正准备发布那个版本时,更强大的模型出现了,像 Claude Code 和 Codex 这样的工具展示了更开放式编码代理的能力。我们在 Claude Agent SDK 上构建了一个原型,感觉比我们之前的东西好多了,于是我们取消了发布,决定重建代理。
重建主要围绕 SDK 的三个部分:一个用于可靠运行长时间代理会话的执行环境,一个将平台暴露给代理的 CLI,使代理能够像工程师一样操作 Intuned,以及一个基于我们构建浏览器自动化经验的自定义插件(技能 + MCP)。
基础设施和代理的集成是产品变得更有趣的地方。运行时不仅运行自动化,还会捕获调试失败时所需的上下文:参数、结果、跟踪、日志。这使得“AI 修复”等功能成为可能,您可以打开一个失败的运行,让代理进行调查并准备修复。
同样的集成也支持一个名为“自我修复”的功能。对于已配置的项目,平台会检测到故障,启动一个带有相关上下文的代理会话,然后要么提出修复建议供审查,要么自动部署修复。演示:<a href="https://youtu.be/IVHIXw0lYMs">https://youtu.be/IVHIXw0lYMs</a>
我们最近还将基础设施和代理打包成了一个名为 Web Task API 的 API,这里是演示:<a href="https://youtu.be/1olRn3l95vw">https://youtu.be/1olRn3l95vw</a>
我们坚信浏览器自动化可以也应该更快、更便宜、更可预测。欢迎访问 <a href="https://app.intuned.io/">https://app.intuned.io/</a>,我们提供免费套餐,并为您的前几次自动化提供试用积分。期待听到您的想法、问题和反馈!
3 分•作者: lightedman•22 天前
我想了解是否有其他航空航天或国防公司正在使用OBS、Digicam Control或Darktable等图像/视频采集软件,并且其网络安全部门已经审计并批准了此类软件。
我之所以这样问,是因为在为技术人员配置定制成像工作台时遇到阻力,而且我更希望避免花费数十万美元购买软件许可,而这些软件的功能不过是简单的PTP/MTP软件。Digicam Control完全满足我的所有需求,甚至更多,而我正在努力争取的就是允许使用这款特定的软件。网络安全部门表示,如果我能找到其他航空航天/国防公司使用我想要的软件的例子,那我就成功了。
如果不行,是否有其他行业内知名的、兼容尼康Z系列相机、开源且最好是MIT许可或类似许可的、可用于商业用途的图像采集程序?