2作者: joegibbs10 个月前
这是我一直在开发的一个小型演示,可以即时生成完整的维基百科风格的文章(如果服务器没有负载,它应该在两秒钟内生成文章,生成后会被缓存)。 这些文章本身并没有什么教育价值,因为模型很小,而且没有任何事实依据——即使是涵盖非常广泛的事件,你可能也能发现明显的错误——但我正在撰写一篇关于 LLM 非聊天界面的博文,这是其中的一部分。 代码:<a href="https://github.com/joe-gibbs/wiki-simulator" rel="nofollow">https://github.com/joe-gibbs/wiki-simulator</a>
1作者: ianberdin10 个月前
嗨,HN。 目前围绕着 Claude Code 和 AI 代理,整体上掀起了一股巨大的炒作浪潮。 在用 Cursor 四个月,用 Claude Code 一个月之后,我成了一个超级用户。之前我按使用量付费 Cursor,每月最多要花 700 美元,后来改用了他们的新订阅服务,过去一个月我一直在使用付费的 Claude Code 计划。我每天都用这些工具写代码,使用 Sonnet 4.0 和 Gemini 2.5 Pro。这是一份源于经验和挫折的指南。 首先,关于 Claude Code(CLI 代理)的评价。这个想法很棒——在终端上编程,甚至在服务器上。但在实践中,它很差劲。你无法轻松跟踪它的更改,几天之内,代码库就会变成一团乱七八糟的黑客行为和辅助手段。与 Cursor 相比,质量和生产力至少差了三倍。这是一种倒退。但它可以用来制作一次性的原型,而不用担心代码库。 现在,我们来谈谈 LLM。这是最重要的教训:模型不会思考。它们不是你的伙伴。它们是高度敏感的计算器。最好的比喻是时间旅行:改变过去的一个微小细节,整个未来都会不同。LLM 也是如此。你的输入上下文中一个微小的变化会完全改变输出。输入垃圾,输出垃圾。没有偷懒的余地。 理解这一点会改变一切。你不再希望 AI 会“搞清楚”,而是开始设计完美的输入。在我的编辑器和通过它们的 API 对 LLM 进行了广泛的工作之后,以下是获得高级代码而不是初级代码的不可协商的规则。 绝对的上下文是不可协商的。你必须在上下文中提供 99% 的相关代码。如果你遗漏了一点点,模型就不知道它的边界;它会产生幻觉来填补空白。这是错误的主要来源。 为 AI 重构你的代码。如果你的代码太大,无法放入上下文窗口(Cursor 的最大值为 20 万个 token),那么 LLM 对于复杂的任务就毫无用处。你必须编写干净、模块化的代码,将其分解成 AI 可以消化的小块。架构必须服务于 AI。 强制输入上下文。Cursor 试图通过限制它发送的上下文来节省资金。这是一个致命的缺陷。我构建了一个简单的 CLI 工具,它使用正则表达式来获取所有相关文件,将它们连接成一个文本块,并将其打印到我的终端。我复制整个 15 万到 20 万个 token 的块,并将其直接粘贴到聊天中。这是获得良好结果的最重要的技巧。 隔离任务。只给 LLM 一个你可以自己跟踪的小而孤立的工作。如果你无法定义任务的确切范围和边界,AI 就会失控,你最终会得到一团你无法解开的混乱。 “该死!重做。” 永远不要让 AI 修复它自己的错误代码。它只会越挖越深。如果输出是错误的,就完全放弃它。恢复更改,完善你的上下文和提示,然后从头开始。 与 LLM 合作就像处理一只具有攻击性的、强大的斗牛犬。你需要一个带刺的项圈——严格的规则和完美的上下文——来控制它。
1作者: fwystup10 个月前
我最近在斯图加特 Java 论坛上做了一个关于 AI 编码工具的演讲。在准备演示和切换不同的 AI 助手时,我意识到不断切换环境和工具是多么的繁琐。这激发了我开发 XaresAICoder 的想法。 问题:许多开发人员无法在他们的公司笔记本电脑上安装工具,但又想尝试 AI 编码。其他人则浪费时间管理端口、环境,并担心 AI 代理意外修改项目范围之外的文件。 我的解决方案:XaresAICoder 提供基于浏览器的隔离开发环境,核心是 VS Code(通过 code-server)。每个工作区都预先配置了 Claude Code、Gemini CLI、OpenCode SST 和 Aider - 允许您测试不同的 LLM(包括使用 Aider 的本地托管模型),而无需安装的麻烦。 主要特点: * 一键式项目创建,支持 Python/Flask、Node/React 或 Java/Spring 模板 * 沙盒执行 - 无端口冲突或意外的文件修改 * 集成的 Forgejo Git 服务器,用于自动版本控制 * 在 WSL、Linux(本地或服务器)上运行,macOS 应该也可以运行(有人能确认一下吗?) * 容器级密码保护,适用于研讨会/内部网络 这不仅仅是另一个“氛围编码”的浏览器工具 - 这是一个真正的开发环境,适用于需要适当工具但面临安装限制或希望进行更安全的 AI 实验的专业开发人员。所有代码都是开源的,并且运行在您的机器上。而且:主要由 AI(Claude)制作;当您只是坐着观看 claude code 修复 docker 配置问题并进行测试运行时,效果非常好。 我很好奇:您在使用 AI 编码助手时最大的摩擦点是什么?很乐意讨论架构!