1作者: BohdanPetryshyn8 个月前
向在产品中拥有聊天界面的开发者提问:你们会监控用户提出的问题吗?你们是如何做的? 昨天,一位朋友问了我这个问题;他想知道诸如“用户要求我的助手无法完成什么?”、“用户讨厌什么?”、“他们喜欢什么?”之类的问题。 来自另一家小型初创公司的快速见解——他们规模很小,所以他们直接复制了数据库中的所有对话,并让ChatGPT来分析它们。他们发现,用户最常要求的缺失功能是在消息中使用URL。 我还发现有人尝试围绕此构建产品,但该项目似乎已被放弃:https://web.archive.org/web/20240307011502/https://simplyanalyze.ai/ 如果确实没有针对此问题的解决方案,并且除了我的朋友之外还有更多人需要这个功能,我很乐意为此构建一个开源工具。
2作者: vnglst8 个月前
当您要求大型语言模型将著名画作重新创作成简单的矢量图形时,会发生什么?这个画廊展示了它们将艺术品转化为 SVG 图像的尝试。这之所以有趣,并不是因为生成式人工智能(GenAI)可以根据提示生成图像——专门的模型已经可以做到这一点。而是它们如何将艺术知识与编写 SVG 代码的能力结合起来。<p>该项目受到 Simon Willison 将其用作创意 LLM 基准测试实践的启发。当发布新模型时,他的首批测试之一就是它是否可以生成骑自行车的鹈鹕。<p>它还附带一个工作坊功能,我用它来添加或生成新的艺术品。您也可以通过在本地启动项目(并提供 OpenRouter API 密钥)来自己使用它。您可以在这里看到它的实际效果:<a href="https:&#x2F;&#x2F;x.com&#x2F;vnglst&#x2F;status&#x2F;1971461976040800730" rel="nofollow">https:&#x2F;&#x2F;x.com&#x2F;vnglst&#x2F;status&#x2F;1971461976040800730</a>
5作者: george3d68 个月前
我最近在关注 VR 和 AR 设备。<p>(顺便说一句:因为分辨率已经足够高,我可以开始写代码了,而最佳的编码姿势是在倒立架上用键盘——这对显示器来说非常不理想)<p>我注意到除了苹果之外,<i>所有</i>这些设备都运行安卓系统。<p>我理解为什么安卓已经成为移动设备的“不幸”标准,但它现在正在接管 VR(以及“物联网”设备、车载电脑等等),这在我看来很荒谬。<p>它似乎是一个非常不优雅的操作系统,在所有方面都选择了错误的范式:<p>- 选择了 JVM 而不是支持静态编译——将自己锁定在一个无法看到 Rust 或简单脚本语言曙光的死亡生态系统中 - 拥有重量级的安全抽象,实际上除了一个 Linux 内核之外,并没有实现多少功能 - 依赖于大量专有模块来实现 &lt;任何事情&gt; - 并且(现在)拥有大量源于向后兼容性地狱的新功能<p>我甚至无法理解将一个像样的 VR 体验所需的 GPU 密集型和光线追踪功能移植到这样的系统上(相比于一个专注于光线追踪的极简 Linux 发行版)需要付出多么巨大的努力。<p>是我对安卓不公平,错失了它的核心优势吗?是集体癔症吗?我是否错过了它变得如此流行的根本原因?<p>(需要说明的是:我假设 visionOS 很糟糕,因为它来自苹果,这只是让我困惑,为什么例如 Meta 不开发自己的操作系统)
1作者: baalimago8 个月前
首先,澄清一下我所说的 AI 代理是什么意思:一个利用大型语言模型 (LLM) 的脚本不是代理。它是一种自动化,或者说是一种“工作流程”(根据 Anthropic 的说法)。AI 代理是一个系统,它通过使用工具 + 记忆来收集关于输入的信息,从而处理复杂的语义输入,最后将其处理成某种“基于判断”的响应。 <p>编写关于您所在城市当前天气的诗歌的 shell 脚本 -> 自动化。</p> <p>用于客户支持的聊天机器人 -> 代理。Codex/Claude Code -> 代理。</p> <p>主要区别在于,代理会根据其需要解决的任务构建自己的上下文。</p> 我听到了很多关于 AI 代理的讨论,但我还没有看到很多成功的案例,这些案例能够很好地契合并提供比其开发和维护成本更高的价值(编码代理除外)。所以,请分享您的 AI 代理成功案例!