2作者: yaoke259大约 1 个月前
简单介绍一下背景,我目前正在工作中组建一个 AI 智能体团队,通过分发到大量子智能体来处理大量转录数据,从而生成报告。当分析在中途失败时,例如某个 API 调用返回错误或机器内存不足,就会引发级联错误,导致整个生成过程崩溃,而且几乎没有任何可见性。过去一个月我一直在将各个任务重写为 DBOS 上的持久化执行任务,但想知道是否有更好的解决方案,以及其他人是否遇到过类似的问题?还有一个问题是如何向用户反馈进度,老实说,我一直在临时编写代码… 当一个智能体在 12 个步骤中的第 9 步失败时,您是如何处理的? 您在智能体基础设施(持久性、监控、人工介入、实时 UI)上投入了大约多少工程师周,与实际的智能体逻辑相比?很好奇我的比例是否正常。 对于那些自己构建了这类东西的人来说:是否曾有过构建与购买的讨论?一个工具需要具备什么功能才能让您选择购买而不是构建? 您目前是否为您的智能体堆栈中的任何东西付费(LangSmith、Temporal、Braintrust 等)?是什么让它值得成为一个单独的条目,而其他的不值得,我也应该考虑一下吗?
1作者: joas_coder大约 1 个月前
我制作了我的第一个 macOS 实用程序应用,它捆绑了一个 Gemma 4 模型,具体来说是 Gemma E4B 模型。这使得我的应用 DMG 文件大小达到了 5.3 GB,但我认为对于这个免费的本地模型所能提供的强大功能来说,这已经很小了。<p>它在 CPU 上运行良好,也可以在 Apple Silicon GPU 上运行,尽管我没有注意到使用 GPU 带来的任何性能提升(在 M5 芯片上测试)。<p>我认为这些本地轻量级和多模态模型将为注重隐私的新软件工具开启多种可能性。
13作者: Throwaway_sys大约 1 个月前
我不想在退役报告中留下空白,所以我想在这里问一下。<p>我正在为一个合同工作清理一个数据中心,进行盘点和审计等常规工作,然后退役硬件。问题是有一个节点一直在出现,但它不在文档中。IP 地址在 46.28.x.x 范围内,但它不在设施注册表中。我通过 RIPE 和 ARIN 查询过,但一无所获。<p>然而,让我感到困惑的是延迟。每次往返延迟都是 0.4 毫秒。我从多台机器上进行了测试,包括一台使用 LTE 的手机,都得到了相同的响应时间。理论上,这应该意味着我离机器非常近,但这在三个不同的连接上说不通。<p>我检查了物理硬件,它是我从未见过的。不是标准的 1U 或 2U 端口,可能是专有的。序列号格式是:<p>CC-[4 位数字]-[2 位数字]-[6 位字母数字]<p>CC 前缀与思科、IBM、DEC、3Com 或任何其他厂商都不匹配。我查阅了该设施的历史日志。该节点出现在其最早的记录中,这些记录可以追溯到 1994 年,而该设施建于 1997 年。<p>有人见过 CC- 序列号前缀吗?或者对这种持续的低延迟有解释吗?
1作者: rallies大约 1 个月前
过去十年,我一直是一名人工智能工程师,并且在周末持续构建小型算法交易系统。 现在我将全职进入金融领域,并开始构建一个针对个人用户的净值追踪 / 自主金融 / 大型语言模型驱动的投资产品(B2C)。 我希望尽可能多地阅读相关书籍,以便深入了解这个领域,以及它的运作方式等。 有什么推荐吗?不限于书籍。也欢迎任何建议。