2作者: tito7779 个月前
大家好,我是 Bayang。我正在推出 Runtime——一款桌面工具,它使用小巧、可复用的技能来自动化你的现有浏览器,而不是使用庞大、脆弱的提示。 链接: * README: [https://github.com/runtime-org/runtime/blob/main/README.md](https://github.com/runtime-org/runtime/blob/main/README.md) * 技能指南: [https://github.com/runtime-org/runtime/blob/main/SKILLS.md](https://github.com/runtime-org/runtime/blob/main/SKILLS.md) 我为什么开发它? 我一直在用浏览器自动化来完成自己的工作,但它变得缓慢且昂贵,因为它将页面上的大量内容推送到模型中。我也看到了像 browser-use 这样的代理系统,它们试图流式传输实时 DOM/已处理的内容并“猜测”下一个点击。这看起来很酷,但感觉很笨重而且不稳定。 我问了几个朋友,他们真正希望拥有一个能完成他们一些工作的浏览器,比如重复性任务。这三个人都说:“我希望能够教我的浏览器,或者只是向它解释如何完成我的任务。” 还有:“请不要让我切换浏览器——我已经有了我的扩展程序、主题和设置。” 这就是 Runtime 的由来:保留你的浏览器,保持控制,使自动化可预测。 Runtime 接受聊天中的任务(我乐于挑战与 Runtime 交互的用户体验),然后运行由技能组成的简短计划。一个技能是一组函数:它有输入和预期的输出。例如:“搜索网站”、“打开结果”、“提取产品字段”、“点击按钮”、“提交表单”。由于计划使用技能(而不是整个页面),提示保持很小,流程保持确定性和快速。 有什么不同? * 使用你的浏览器(Chrome/Edge,很快支持 Brave)。无需安装新浏览器。 * 设计上具有确定性。技能是明确且类型化的;运行是可审计的。 * 低 token 使用量。我们传递紧凑的操作,而不是完整的 DOM。最重要的是,我们根本不截屏。我们认为,如果使用选择器进行导航,截屏是无用的。 * 人机交互。你可以观察步骤并随时停止/重试。 它适合谁? 在网络上进行研究/运营的人:提取结构化信息、填写表格、在工具之间移动数据,或者运行可重复的流程,而无需编写完整的 RPA 脚本或使用任何 API。它只是“运行时在运行时运行”。 首先尝试这个(5-10 分钟) 1. 克隆存储库并按照 README 中的快速入门进行操作。 2. 运行一个示例流程:搜索 → 打开 → 提取字段。 3. 阅读 `SKILLS.md`,然后为你每天使用的网站制作一个微小的技能。 哪些方面还不够完美? 网站会发生变化。技能也会变化,但我们将发布关于解决此问题的信息。 我很想知道它在哪里崩溃。 我征求的反馈: * 技能格式是否清晰?声明式是否有所帮助? * 规划器在哪里过度/未充分指定步骤? * 我们应该首先为哪些网站提供技能? 很乐意在评论中回答所有问题,并且希望得到详细的分析。谢谢! Bayang
2作者: lincoln20xx9 个月前
最近,我看到了这里的一条评论 [0],其中强调了使用 LLM 构建原生桌面应用程序的挑战。评论者指出,与 Web 或移动开发相比,培训资源变得多么稀缺——博客文章、教程或开源项目都很少。他们还提到,虽然桌面应用程序开发在 90 年代是一条可靠的职业道路,但现在对于大多数人来说,除了微软或 Adobe 这样的大公司之外,它被视为一条死胡同。 这引发了我的思考:我自己在桌面开发方面的经验可以追溯到 90 年代末,当时使用 Turbo Pascal 6 在 Delphi 中进行开发,而且我对现代实践已经脱节了。随着形势的发展,我很好奇开发者们今天实际使用什么工具和工作流程。 一些问题可以引发讨论: * 哪些编程语言和框架在桌面应用程序中很受欢迎? * 是否有任何常用的 IDE、构建工具或库可以使开发更容易? * 如果您关心代码性能或效率(无论您认为这意味着什么),上述答案是否会发生变化? * 原生桌面应用程序开发作为一种职业是否仍然可行,或者大多数新项目是否正在转向基于 Web 的替代方案? 我很乐意听到有最近经验的人的意见——成功案例、陷阱和建议都很好。感谢您的分享! [0] https://news.ycombinator.com/item?id=44841291
1作者: Taikhoom109 个月前
如今,每个人都在创建一家人工智能公司。每个推介材料都以人工智能为核心,每家初创公司都声称自己是下一个针对特定领域的 ChatGPT,风险投资家们也一直在谈论人工智能革命。 但他们忽略了这一点:当所有人都在涌入同一个被过度炒作的池塘时,真正的财富却在解决那些不那么引人注目的问题的“无聊”业务中产生。 **政府表格的金矿** 让我来告诉你一家完美地说明这一原则的公司。当成千上万的创业者都在构建 GPT 包装器和人工智能聊天机器人时,一个小团队注意到了一件其他人都忽略的事情:申请政府援助的人们正被文书工作淹没。 这个过程简直是官僚主义的地狱——令人困惑的表格、不明确的要求以及与政府部门无休止的来回沟通。大多数科技创业者对此问题根本不会多看一眼。它不性感,不会登上 TechCrunch 的头条,也不涉及机器学习或神经网络。 但你猜怎么着?这款“无聊”的表格填写软件现在每年能产生 3000 万美元的收入。 这正是“在有鱼的地方捕鱼,而不是在渔夫聚集的地方捕鱼”的精髓。当其他所有人都在争夺同一个拥挤的市场时,聪明的创业者会发现未被开发的、拥有真正付费客户的问题。 **为什么“无聊”通常胜过“热门”** 人工智能淘金热让我想起了其他每一次科技泡沫。还记得一切都“由区块链驱动”、“移动优先”或“社交化”的时候吗?那些在这些炒作周期中幸存下来的公司,并不是那些追逐潮流的公司,而是那些碰巧使用这项技术来解决实际问题的公司。 今天的人工智能公司面临三个根本性问题: * **商品化陷阱:** 随着人工智能能力的普及,竞争壁垒消失了。你为律师设计的 AI 聊天机器人看起来与其他所有人为律师设计的 AI 聊天机器人非常相似。 * **炒作后遗症:** 当人工智能泡沫破裂时(它一定会破裂),投资者将要求实际利润,而不仅仅是令人印象深刻的演示。许多现有的人工智能公司没有明确的盈利途径。 * **依赖风险:** 将你的整个业务建立在快速发展的人工智能模型上,意味着你离被淘汰只差一个 API 变更。 **如何找到你的“无聊”金矿** 找到这些被忽视的机会并非偶然,而是一种系统的问题识别方法: * **从你自己的痛点开始** 最好的商业创意往往隐藏在你日常的挫折中。哪些流程让你想尖叫?哪些任务毫无意义地消耗了你大量的时间?如果它让你恼火,那么它可能也会让成千上万的其他人感到恼火。 * **挖掘你的人脉** 你的朋友、家人和同事是商业创意的金矿。问问他们:“你工作中什么部分最令人沮丧?”“什么事情花费的时间比它应该花费的时间长得多?”“什么能让你每周节省几个小时?”注意其中的模式——如果多个人提到了类似的问题,你就找到了值得探索的东西。 * **质疑一切手动流程** 在 2025 年,如果还有人使用电子表格来跟踪重要的业务流程,那么很可能存在机会。如果人们还在打印表格、手工填写并传真回去,那么绝对存在机会。寻找那些似乎停留在 1995 年的工作流程。 * **关注抱怨** Reddit、Twitter 和行业论坛上充斥着人们对破损流程的抱怨。这些抱怨帖子基本上是免费的市场调查。 当浮华的初创公司争夺关注时,无聊的业务却享有几个不公平的优势: * **更少的竞争:** 大多数创业者追逐闪亮的东西,导致平凡的问题没有得到充分解决。 * **粘性客户:** 解决运营难题的企业会创建难以替代的深度整合点。 * **可预测的收入:** 无聊的问题往往是持续存在的问题,从而带来订阅收入而不是一次性购买。 * **更低的客户获取成本:** 当你在一个服务不足的市场中解决一个真正的痛点时,客户会通过口碑找到你。