1作者: lorepieri5 个月前
TLDR: 我正在使用 AI 等技术,让机器人远程操作变得更快,并能够在长时间内保持稳定,从而实现大规模的真实机器人数据收集,用于训练机器人基础模型。 我们可能还差 5 到 6 个数量级的数据,才能获得训练机器人基础模型所需的真实机器人数据,那么我们该如何获取这些数据呢?我认为模拟或视频可以作为补充,但无法替代大量的真实机器人数据。 我一直在探索扩展机器人远程操作的方法,传统上,远程操作仅限于缓慢的、高价值的使用场景(如核退役、医疗保健)。这里有一个来自原始测试会话的短视频(需要大量解释!): [https://youtu.be/QYJNJj8m8Hg](https://youtu.be/QYJNJj8m8Hg) 这里发生了什么? 首先,这是真正的机器人远程操作(人们常常将视线范围内的机器人控制与远程操作混淆):我通过 VR 远程操作设置控制机械臂,没有佩戴任何设备,以改善人体工程学,但通过摄像头画面进行观察。通过 Wi-Fi 连接,模拟了 300 毫秒的延迟 + 10 毫秒的抖动(国际往返延迟,例如从英国到澳大利亚)。 右侧展示了纯远程操作的运行情况。忽略那些奇怪的“拖拽”动作,它们是我构建的拖放实现,允许操作员将人手臂重新定位到更有利的位置,而无需移动机械臂。经济实惠的远程操作的一些核心问题是 3D 空间感知能力下降、人-机器人具身差距以及差劲的力觉反馈。再加上网络延迟和有限的机器人硬件灵巧性,导致操作缓慢且精神疲惫。操作员通常采用类似于视频中的“观望”策略,以减少延迟和 3D 感知能力下降的影响。长时间进行远程操作是不切实际的。 左侧,AI 两次帮助操作员,以更高的速度维持长时间的操作。有一个“动作 AI”执行单个动作,例如抓取(目前的“动作 AI”是 VLA [视觉语言动作模型]、计算机视觉、运动规划、动态运动原语的混合;未来它将仅是 VLA),还有一个“人机环路 AI”,它动态地决定何时将控制权交给远程操作员或动作 AI。最终的运动是 AI 和操作员运动的融合,并根据环境和上下文因素进行一些动态加权。通过这种方式,操作员始终处于控制之中,可以处理 AI 无法处理的所有边缘情况,而 AI 则在已经有足够数据的子任务中完成大部分工作。 目前,它可以将有经验的远程操作员的速度提高 100-150%,对于没有经验的远程操作员来说,速度提升会更多。从最初的几次操作中就可以明显地感受到精神负担的减轻。一个重要的挑战是,在长时间的操作中,进一步提高速度,超越人类。从技术上讲,除了 AI 之外,还涉及改进机器人硬件、3D 远程呈现、网络优化、远程操作设计和人体工程学。 我认为这项工作是改善远程操作基础设施、扩大机器人数据收集和部署通用机器人的更大愿景的一部分。 关于我,我目前是英国应用机器人研发实验室 Createc 的 AI 负责人,我在那里构建了混合 AI 系统。同时也是 2 家初创公司的创始人(上一家是 AI-机器人公司,已退出)。 我发布这篇文章是为了尽早收集反馈。如果您觉得这令人兴奋或有用,我很乐意与您联系!我也欢迎早期阶段的合作。
1作者: haya21_85 个月前
Show HN: Enfiy Code – 通用 AI 编程助手,支持多供应商 大家好,HN!我开发了 Enfiy Code,一个命令行 AI 编程助手,它通过单一界面与多个 AI 供应商(Anthropic Claude、OpenAI GPT、Google Gemini、Ollama 用于本地模型等)协同工作。 主要特点: * 无缝切换 AI 供应商 - 比较不同模型的响应 * 使用扩展上下文支持处理大型代码库 * 通过 Ollama 同时支持云端 AI(强大)和本地 AI(私密) * 通过 MCP(模型上下文协议)集成外部工具 * 使用多模态 AI 从 PDF/草图生成应用程序 * 自动处理复杂任务,如 PR 审查和 git 操作 该 CLI 使用 TypeScript/Node.js 构建,并且完全开源(Apache 2.0 许可证)。无需安装即可试用:`npx @enfiy/enfiy-code` 它与其他 AI 编程工具的区别在于供应商的灵活性 - 您不会被锁定在一个 AI 服务中,并且如果注重隐私,可以在本地运行所有内容。 非常欢迎 HN 社区的反馈,特别是关于多供应商方法和 MCP 集成! GitHub:[https://github.com/enfiy/enfiy-code](https://github.com/enfiy/enfiy-code)
1作者: ahaucnx5 个月前
我刚刚创建了一个小测验,揭示了企业法律语言如何将社区困在失去对其环境数据控制权的境地中。 它基于空气质量监测设备制造商的典型条款和条件。 试试看,看看你是否能发现其中的危险信号: [https://www.airgradient.com/aq-data-ownership-quiz/](https://www.airgradient.com/aq-data-ownership-quiz/) 这个游戏的目的是提高大家对数据所有权权利的认识,例如: - “共同所有权”实际上并非共享 - 为什么“免费”服务经常在没有警告的情况下删除你的数据 - 订阅模式如何将你社区的空气质量数据“劫持” - 数据访问和数据所有权之间的区别 这款游戏的设计灵感来自于EPIC空气质量基金会的杰出工作,该基金会致力于扩大空气质量数据的获取。他们的研究表明,近40%的国家缺乏开放的空气质量数据——这通常是因为限制性的企业条款阻止社区真正拥有他们的环境信息。 在AirGradient,我们认为开源硬件是最终的解决方案。当社区同时控制硬件和数据时,他们才能实现真正的环境正义。
1作者: yt13145 个月前
大规模广告投放中,跨境团队常常面临“平台壁垒”挑战:Facebook广告素材需要手动调整尺寸才能在Instagram上使用;TikTok的定向参数无法同步到Google Ads;超过60%的流量来自单一渠道,难以实现多元化。这些问题导致投放效率降低40%,甚至可能因渠道依赖性而使团队面临流量波动风险。 Yajuzhen云手机通过“跨平台协作中心 + 本地化投放引擎”,实现了素材、受众和数据在6大广告平台(Facebook、TikTok、Google等)之间的同步。这使得多渠道流量占比从40%提升至85%,投放ROI提升50%。 本地化素材生成:核心素材自动生成多语言版本。针对德国市场,英文关键词搭配德语注释;针对东南亚市场,添加马来语配音和本地化背景(如吉隆坡双子塔)。某3C品牌通过此功能,将本地化素材的点击率(CTR)提升了28%。 二、跨平台受众策略同步:降低冗余测试成本: 跨平台标签映射:将“购买瑜伽垫的25-35岁女性”等核心特征自动转换为平台专属标签:Facebook上的“瑜伽器材”、Google上的“瑜伽垫测评”、TikTok上的“瑜伽教程观看”。某运动品牌将新平台测试时间从7天缩短至2天。 受众细分同步:当Facebook的“高转化受众”新增10万用户时,系统会将相同画像同步至Google Ads和TikTok,并根据平台规则调整规模(例如,Google保留80%的重叠用户;TikTok扩展20%的相似用户)。某美妆品牌将多平台受众重叠度从15%提升至42%。 三、智能投放节奏协调:平衡渠道流量占比 过度依赖单一渠道(例如,超过60%的流量)存在风险:算法变化可能导致流量崩溃,议价能力下降则会提高获客成本。Yajuzhen通过“智能流量分配中心”动态调整跨平台投放: 阈值预警 & 自动分流:当某个平台流量占比超过50%时,系统会削减其20%的预算,同时提高出价(例如,Google Ads +10%)。某跨境零售商将单一渠道依赖度从65%降低至30%。 分时段投放:策略与平台高峰时段对齐:Facebook在20:00-22:00(欧美晚间)发力,TikTok侧重12:00-14:00(午休时段),Google覆盖0:00-6:00(深夜搜索)。这使得每日流量利用率提升35%。 四、跨平台数据资产整合:打破渠道数据孤岛 广告数据分散于平台后端,阻碍统一分析:Facebook的“转化路径”与TikTok的“互动漏斗”不同;Google的“搜索词报告”无法关联Instagram的“素材表现”。Yajuzhen通过“全球数据中心”整合数据: 多平台素材同步将发布周期从5天缩短至1.5天,实现6平台同步发布; 受众标签映射将Google/TikTok测试成本降低40%,新增2个核心渠道; 流量分配系统将Facebook流量占比降至35%,TikTok+Google占比达到45%; 数据中心识别出Instagram视频素材转化效果最佳,整体ROI提升62%。 品牌负责人表示:“Yajuzhen不仅仅解决了‘多平台烦恼’,更构建了‘流量生态韧性’。当一个渠道波动时,其他渠道会填补空缺。这种抗风险能力在跨境市场至关重要。” Yajuzhen云手机的核心价值在于将“分散式投放”升级为“协同式运营”:打破平台壁垒,让素材、受众和数据在渠道间自由流动。这创造了流量互补、风险分散和效率提升的良性循环。对于追求规模的品牌而言,这不仅仅是工具升级,更是一场流量战略的变革。