1 分•作者: CeresBroker•10 个月前
返回首页
最新
1 分•作者: surprisetalk•10 个月前
1 分•作者: surprisetalk•10 个月前
1 分•作者: surprisetalk•10 个月前
1 分•作者: ezekg•10 个月前
1 分•作者: ch3nyang•10 个月前
1 分•作者: mikece•10 个月前
7 分•作者: OsmanDKitay•10 个月前
您好,
我一直在带着兴奋和担忧的心情关注着 AI 智能体的崛起。我们正在构建令人难以置信的工具,它们可以浏览网页,但我们却强迫它们在一个为人类设计的世界中导航。它们抓取屏幕内容,解析脆弱的 DOM 结构。
我们试图驯服它们,让它们像人类一样行动。我认为这从根本上就是错误的。我们的目标不应该是让 AI 达到人类的水平,而是要释放其超人的潜力。
目前的道路是危险的。当来自 OpenAI、Google 等公司的智能体开始大规模、高速地浏览网页时,UI/UX 等概念对它们来说将失去意义。整个 Web 的模式都受到了威胁。网站所有者正在失去对其网站使用方式的控制权,而且没有人提供真正的解决方案。W3C 正在考虑这个问题,而我决定亲自构建它。
这就是我创建 AURA(智能体可用资源声明)的原因。
它是一个开放协议,具有一个简单而强大的理念:让网站所有者声明 AI 可以做什么,不可以做什么。网站不再让智能体去猜测,而是提供一个简单的 aura.json 清单。
这让网站所有者重新获得了控制权。它从让 AI 抓取数据转变为授予其能力。我们可以定义交互规则。这使我们能够增加 AI 的能力,不是通过放任自流,而是通过为它们提供清晰、结构化的路径。
坦白地说:我不是一个硬核程序员;我更倾向于认为自己是一个系统思考者。实际上,我广泛使用了 AI 来帮助我编写 AURA 的参考实现。使用这个工具来构建它自己的护栏,感觉很合适。
该协议的核心、一个参考服务器和一个客户端都在 GitHub 上开源。您可以在 5 分钟内看到它的运行情况:
克隆并安装:git clone <a href="https://github.com/osmandkitay/aura.git" rel="nofollow">https://github.com/osmandkitay/aura.git</a> && cd aura && pnpm install
运行服务器:pnpm --filter aura-reference-server dev
运行智能体:(在新终端中)pnpm --filter aura-reference-client agent -- http://localhost:3000 "列出所有博客文章"
您将看到智能体直接执行任务,无需抓取或解析 DOM。
GitHub 仓库在这里:<a href="https://github.com/osmandkitay/aura" rel="nofollow">https://github.com/osmandkitay/aura</a>
我不知道 AURA 是否会成为标准,但我认为我有责任提出这个问题并开始讨论。这是 Web 发展的一个根本性问题。它需要成为一项社区努力。
该项目采用 MIT 许可证。我将全天候在这里回答问题并听取您的反馈——尤其是批评性的反馈。让我们一起讨论吧。
4 分•作者: ricecat•10 个月前
GitHub 的 CEO 最近告诉开发者,如果他们不拥抱像 Copilot 这样的 AI 工具,就应该考虑退出这个行业。这被包装成建议,但坦白说——这是一种隐晦的威胁:购买我们的 AI,否则我们将用使用它的人取代你。
当那些控制算力、模型和平台的人也试图掌控劳工的未来时,就会发生这种事。开发者——那些代码被抓取、创意被用来训练模型、无偿贡献填充 GitHub 的人——现在却被告知要付费或消失。
2 分•作者: Cyruskandilat•10 个月前
我和我的朋友一起构建了这个东西,因为我们想用一种更有趣、更互动的方式来学习。我们认为我们可以围绕这个建立一个社区吗? 肯定还有很多工作要做。 很好奇你们的想法,以及我们可以在哪些方面改进学习体验。
27 分•作者: walterbell•10 个月前
74 分•作者: kgwgk•10 个月前
103 分•作者: 6d6b73•10 个月前
34 分•作者: rasca•10 个月前
在使用 `claude code` 这样的工具时,我很难进入心流状态,因为每次交互后都得等待。我很容易分心,思绪飘忽,不知不觉就去刷 Hacker News 和浏览网页了。
虽然我完成大部分任务的效率提高了,但在这些分心的事情上,我经常会不知不觉地浪费很长时间。我试过保持控制台开启,阅读 AI 助手的处理过程,但几次交互后我就开始紧张了。
而且,我也不太享受这个过程。完成一个新功能后,我没有成就感,一切都感觉支离破碎。
即使使用多个会话也无济于事,因为我需要每次都切换任务上下文。 这种情况也有人遇到吗? 有什么建议吗?
在 AI 编程仍然需要不断的手动操作和审查的过渡时期,你认为我们如何才能进入心流状态呢?
3 分•作者: snipo•10 个月前
我厌倦了逐个发送视频,所以我开发了一个 Chrome 扩展程序,可以一键将 YouTube 视频笔记发送到 NotebookLM。<p>它的工作原理如下:<p>在 YouTube 上打开任何频道、播放列表、搜索结果或视频。<p>点击 NotebookLM 按钮,选择现有笔记本或创建一个新笔记本。<p>该扩展程序会将所有可用的视频发送到 NotebookLM,直到达到限制。<p>该扩展程序免费使用,适用于 Chrome。我很乐意听取您的反馈!
3 分•作者: takigon•10 个月前
嗨,Hacker News!我一直在开发 BookWith,一个开源电子书阅读器,它集成了 AI 作为你的阅读伴侣。
问题:传统的电子阅读器是被动的。当你遇到不清楚的内容时,你必须切换上下文去搜索。你的高亮和笔记是孤立的,你无法轻松地将不同书籍中的想法联系起来。
我的解决方案:BookWith 嵌入了一个 AI,它维护你正在阅读内容的完整上下文。它具有以下特点:
- 上下文感知 AI 聊天:询问关于当前页面/章节的问题,并获得即时答案
- AI 播客生成:使用 Google Cloud TTS 自动将书籍内容转换为对话式播客
- 多层记忆系统:短期(最近 5 次对话)、中期(每 20 次总结)和长期(向量搜索)记忆,在阅读过程中保持连贯性
- 智能注释:5 色高亮系统,AI 可以参考和分析
技术栈:基于 Flow(epub 阅读器)的分支构建,增加了 LLM 集成和用于语义搜索的向量数据库。支持多种 LLM 和语言(EN/JA/ZH)。
1 分•作者: andsoitis•10 个月前
1 分•作者: sixhobbits•10 个月前
1 分•作者: jgalt212•10 个月前
1 分•作者: rbanffy•10 个月前