1作者: moomoo119 个月前
我正在尝试自动化我们目前的一些手动流程,但仍然无法克服这个障碍。我到底哪里做错了? 我正在使用这些 AI API 来进行实际的处理工作,说实话,我感到很沮丧,甚至有些愤怒。这些 AI 公司向我们兜售一些关于自动化的宏大愿景,但实际使用他们的服务却令人失望。 1. 结果从不一致。“请确保提取所有项目” -> [项目 1,项目 2,项目 3,“实际上是一个注释 // ...剩余项目”] 搞什么鬼!!有时候它会给我一个所有项目的完整列表,有时候它会搞这种鬼。我提供了一个工具,但它有一半的时间只抓取前 3 个,也许还会抓取最后一个(忽略中间的所有内容)。 2. 由于结果不可靠,我不得不进行更多的后处理。大约 60% 的时间,即使在后处理之后,我也必须拒绝,因为它们没有达到我的置信度阈值。 3. 这些 API 得到了供应商的糟糕支持。 - iOS 有一些疯狂的行为,文件扩展名有时是 .jpg 或 .JPG 等。例如,OpenAI 的 API 将返回“Bad Request”,因为扩展名不是“.jpg”,所以现在我必须添加更多代码来确保当用户上传文件时,我重命名文件。 - 文档会说它支持一系列文件格式,但随后拒绝请求,因为它不是 .PDF,即使目的是“助手”(文档说可以处理图像)。没问题,我来转换一下… - 处理来自其他来源(G Drive 等)的文件,这些文件缺少扩展名但存在 MIME 类型… 再次,Bad Request。 4. 我们从 2024 年的“AGI 指日可待”变成了今天的“_A_rtificial _S_uper _I_ntelligence 指日可待”。我们能不能放松一下?我是否掉进了营销陷阱? 我认为 LLM 对于 Cursor 等应用程序或客户支持非常有用,因为它们不需要给出“完美”的响应,因为人工操作员会进一步提示它。你不得不处理来自 Cursor 的愚蠢输出多少次(我是一个高级用户,我每天都在处理这个问题)。RAG 是一个很酷的应用程序,我认为那里实际上不需要正确性或精确性。我已经输入了数百条笔记,我有时会参考它们。每次我都会得到不同的答案,但我不需要它们是完美的。 :q!
1作者: schuon9 个月前
大家好,我是 Schub 的 Sebastian。<p>我们刚刚开源了一个我一直在做的新项目,名为 legacy-use,很想听听大家的想法。<p>在 Schub,我们一直在构建能够自动化旧版 Windows 软件(医疗保健系统、金融工具、电子病历)的代理,这类软件至关重要,但自 Windows XP 时代以来就没怎么变过。这些应用程序没有 API,通常需要人工整天点击操作。<p>因此,我们构建了 legacy-use,这是一个针对任何桌面应用程序的代理 API 层。确切地说,是针对任何软件。Legacy-use 允许 AI 代理通过模拟鼠标和键盘输入来控制基于 GUI 的软件,并提供完整的视觉反馈。就像 UIPath 一样,但对错误更具容错性。它基于 Anthropic 的 Computer Use,并将其功能扩展到 Windows / Linux / 任何系统上的旧版工具。<p>工作原理:<p>- 我们构建了连接到旧版系统的基础设施(如 RDP / VNC + VPN),并处理队列 - 我们向目标系统执行提示,并处理所有日志记录 / 监控 - 我们允许代理提取数据并将其公开为 REST API。 - 我们构建了安全措施,如果出现问题,可以调用人工操作员<p>我们已经看到了一些非常有趣的实际应用:<p>- 一家医疗机构使用 GPT + legacy-use 自动化了 30% 的行政工作 - 一家会计师事务所将其连接到一个 2009 年的金融应用程序,现在可以完全无人值守地生成合规性报告<p>让我兴奋的是:我们 GDP 中很大一部分的产业都依赖于旧版软件来运营业务。而且这种情况在短期内不会改变,因为这些软件是针对特定用例定制的。因此,为了让他们从代理革命带来的自动化中获益,他们需要开放他们的旧版系统。这就是我的愿景:允许访问任何现有的 IT 系统,以便公司能够参与代理革命。<p>这是代码库:[GitHub 链接在这里]<p>非常欢迎您的反馈,如果您想开创一个用例,我很乐意与您交流。如果您有一些一直想自动化的旧内部应用程序,我很乐意帮助您连接您的第一个流程。<p>让我们将旧版软件带入代理时代。<p>— Sebastian
3作者: damiaozi9 个月前
我一直在探索早期的 Unix 系统,特别是使用 SIMH 模拟器的 *PDP-7 上的 Unix V0* 及其后继版本 *PDP-11 上的 Unix V1*。<p>有趣的是,现代 shell 中最常用的命令之一 `cd` 在这些早期版本中 *并不* 存在。<p>- 在 *Unix V0* 中,目录切换是通过一个名为 `ch` 的 shell 命令完成的,该命令与一个名为 `dd`(directory directory,目录目录)的特殊目录结合使用。例如,要进入 Ken 的主目录,需要输入 `ch dd ken`。这似乎反映出当时还没有实现完整的层次文件结构。我已经在 SIMH 模拟器中验证了这种行为。<p>- 在 *Unix V1* 中,方法变得更加熟悉:你使用 `chdir /usr/ken`,但仍然 *不是* `cd`。这也在 SIMH 上得到了验证。Dennis Ritchie 在《Unix 分时系统的演变》中提到:<p>&gt; “顺便说一句,_chdir_ 被拼写为 _ch_;我不记得当我们转向 PDP-11 时为什么会扩展它。”<p>现在,有趣的地方来了:<p>在阅读 [Unix V0 shell 源代码 (`pbsh.s`)](https://github.com/DoctorWkt/pdp7-unix/blob/master/src/other/pbsh.s#L199C1-L210C18) 时,我发现了一些似乎在检查与字符串 `“chdir”` 匹配的内置命令的东西——但它比较的是前 3 个字符,而不是 2 个或 5 个:<p>```asm &quot; https://github.com/DoctorWkt/pdp7-unix/blob/master/src/other/pbsh.s#L199C1-L210C18<p>chdirstr: &lt;ch&gt;;&lt;di&gt;;&lt;r 040<p>. . . . . .<p>&quot; 检查内置的 &quot;chdir&quot; 命令 lac argv0 sad chdirstr skp jmp 1f lac argv0+1 sad chdirstr+1 skp jmp 1f lac argv0+2 sad chdirstr+2 jmp changedir ```<p>这种逻辑表明它应该匹配类似 `chd` 的字符串——因为只比较了前 3 个字符(`argv0`、`argv0+1`、`argv0+2`)。<p>然而,当在 SIMH 中运行 Unix V0 时,我只能让 `ch` 工作——`chd` 似乎没有被识别为命令。这似乎与 shell 源代码所暗示的相矛盾。<p>有人在早期的 Unix shell 中看到过 `chd` 被记录或工作吗?<p>很想听听其他探索过这一层 Unix 考古学的人的意见。