返回首页

一周热榜

1作者: hsong11014 天前
这个想法源于一个问题:“现在还有谁?”—— 当你感受到、做某事或思考某事时,你会想知道世界上是否有人正在经历同样的事情。 它是如何运作的:你写下你的想法(最多 250 个字符)。AI 生成一个嵌入并对主题进行分类。这个想法会以你所在位置的 3D 地球上的光点形式出现,并作为一颗星星出现在由相似想法组成的星空中。点击一颗星星即可看到这个想法。线条将其连接到世界各地相似的想法,形成共享体验的星座。 搜索功能的工作方式相同——输入一个感受,例如“睡不着”或“刚下班”,地球就会重新排列,显示世界各地正在经历同样事情的人。 App Store:<a href="https:&#x2F;&#x2F;apps.apple.com&#x2F;us&#x2F;app&#x2F;astruno&#x2F;id6758970345">https:&#x2F;&#x2F;apps.apple.com&#x2F;us&#x2F;app&#x2F;astruno&#x2F;id6758970345</a> Google Play:<a href="https:&#x2F;&#x2F;play.google.com&#x2F;store&#x2F;apps&#x2F;details?id=ai.mokabyte.astruno">https:&#x2F;&#x2F;play.google.com&#x2F;store&#x2F;apps&#x2F;details?id=ai.mokabyte.as...</a>
1作者: Frauber844 天前
Hello HN, 我是一名热爱自制工具的乐理老师。我最新的项目是 MidiStickers,一款使用 MIDI 乐器进行音乐教学和学习的桌面软件。 它的 UI 概念是“每个工具都是一个浮动小部件”,这源于我对疫情期间视频录制设置的沮丧。现在我只需要在课上拖放和重新排列即可。 通常的流程是:演奏你的乐器,并使用小部件进行谱表/乐器可视化、罗马数字分析、数字低音、德国功能理论、爵士钢琴配音、和弦-音阶关系等等。动态着色方案可用于音符名称、音级、和声功能和力度(速度),提供了一个生动的视觉环境,这绝对塑造了我最近的教学。我的“顿悟”时刻来自于一位学生及时提醒我,我在课堂演示前忘记打开它了。 顺便说一句,虽然“公开构建”现在很流行,但这款软件实际上是在“课堂上构建”的——每周都会从 30 多名学生的实战测试中获得改进。毋庸置疑,一路上也发生了一些令人尴尬的崩溃。 最近,我还超越了可视化,将其变成了一个用于学习键盘和声的交互式练习册。你可以通过(自动)伴奏和进度跟踪来练习音程、和弦和进行——根据我的经验,没有什么比亲身实践更好了! 演示版(Win/Mac)可在以下网址获取:<a href="https:&#x2F;&#x2F;github.com&#x2F;frauber84&#x2F;MidiStickers-Demo&#x2F;releases&#x2F;tag&#x2F;v1.1.0" rel="nofollow">https:&#x2F;&#x2F;github.com&#x2F;frauber84&#x2F;MidiStickers-Demo&#x2F;releases&#x2F;tag&#x2F;...</a> 在这个演示中,你可以探索可视化以及训练工具——后者需要 MIDI 控制器,而前者不需要。 如果我能找到一个在 Linux 上实现透明窗口的稳定解决方案,就会推出 Linux 版本——我使用 SDL3 进行绘图,这一直是一个挑战。
1作者: snthpy7 天前
您好, 我想听听大家对 AI Agent 生态系统中不同组件的看法。我发现目前的术语非常令人困惑,因为在研究可用选项时,我并不总是清楚我实际会得到什么。 很多东西都被称为 Agent,但这个术语似乎很难定义,因为它通常指代重叠的功能。对我来说,Agents 目前似乎由以下组件构成: ## Harnesses (控制框架) * 在 LLM 周围添加 UI 和系统指令,并且可能通过记忆、工具调用等方式对其进行增强。 * 例如:Claude Code, Code, Gemini CLI, pi.dev, ... ## Gateways (网关) * 这些将 Agents 连接到您选择的通信工具,例如 Whatsapp、Telegram、Slack、Discord 等。 * 例如:OpenClaw 和 Nanoclaw ## Sandboxes (沙盒) * 隔离的环境,Agents 可以在其中以有限或可审计的功能运行。 * 例如,可以是物理沙盒,如独立的 Mac Mini,也可以是 docker-agent、agent-sandbox、localsandbox 等。 然后,我们进入 *Agents*: ## Agents (智能体) * 能够行使一定自主权的 AI 系统,即在没有人工干预的情况下具有一定程度的自主行为。 * 这些通常结合了以下组件: ``` - **LLM**: 提供智能/推理/决策能力 - **Harness**: 引导行为并实现超越当前上下文窗口限制的长期行为一致性 - **Gateway**: 与人类和/或其他 Agents 交互 - **Sandbox**: 旨在将 Agent 的能力限制在一组经过批准的安全操作中,以便 Agent 自主执行。 ``` 我的问题是,当我查看可用选项时,通常不清楚我得到了哪些组件: ``` - https://github.com/openclaw/openclaw: Typescript,OG,一站式解决方案,最容易安装,但显然有点像“科学怪人”,而且很复杂 - https://github.com/qwibitai/nanoclaw: Typescript,越来越受欢迎,极简主义,实现似乎依赖于 Claude Code 来处理安装和配置 - https://github.com/sipeed/picoclaw: Golang - https://github.com/zeroclaw-labs/zeroclaw: Rust - https://github.com/nullclaw/nullclaw: Zig - https://nemoclaw.bot/: 由 Nvidia 推出,声称是“基于”开源,但我找不到代码库 ``` 我真正希望的是能够组装自己的 Sandbox + Gateway + Harness + LLM 堆栈。有什么想法/建议吗?