3 分•作者: quinnosha•8 个月前
TL;DR: 我讨厌写测试,我的端到端测试从来没成功过,而且处理浏览器也很麻烦。AI 让情况变得更糟,因为它会更改应用程序中通过单元测试但破坏明显功能的地方。所以我想要并构建了一个系统,它会为你处理一切,然后在每次提交或 PR 后(可配置)用结果更新你。 告诉我你们的想法!
正文:
我写了大量的代码,尤其是在之前的创业想法中使用 AI,并且一直觉得事情进展很快,直到我尝试使用其中的一部分。这在一般情况下并不少见,但我认为 AI 的新事物是,你认为你没有触及的东西也会开始崩溃,因为我没有关注或进行每一个编辑。
诚然,自从那时以来,AI 已经变得好多了,但总的来说,我的观点是,每个人(甚至是 AI)都需要有人对某些东西进行二次审查,然后发送回结果。 这就是 debugg.ai 尝试做的事情(咳咳 - 看看你是否认为我们做到了)。 目前,这种反馈以 PR 审查评论或电子邮件更新和我们的应用程序的形式呈现,但我们的近期计划是提供将这些反馈直接拉回到你使用的任何 AI 中的能力,以便它可以获得自己的反馈并迭代,直到完成。
我厌倦了打开一个 Claude Code 说“完美运行”的应用程序,结果却发现主页甚至无法加载或出现一些 react 水合问题。 这很酷的一点是,即使它可能不是最好的 - 还没有 - 用于超级复杂和详细的测试流程,大多数人也不会编写 E2e 只是为了确保主页加载,因为那是一个“手动”测试的东西。 因为这消除了所有浏览器处理、构建、ci / cd 等设置,你可以拥有真正简单和大量的快速测试,这些测试可以控制你的 AI,并且在你进行更改时也能让你安心。
在技术方面,我确实玩得很开心:
构建了一个特定于用途的爬虫代理,该代理从上到下对你的应用程序进行排序和学习。 把它想象成一个站点地图,但实际上很有用——它知道“主页上的登录按钮 → 带你到 /login → 它有一个表单 → 它发布到 /api/auth”,并包括来自 /auth/components/... 等的文件。
上述内容提高了我们跟踪 github 代码更改并将其与可能受影响的测试关联起来的能力,并为尚未看到的内容创建了新的测试。
最终,我的目标是为自己构建一份工作,这样我就可以提示 Claude 进行更改,然后有一个钩子将 debugg 的测试结果(失败)发送回 Claude,以不断进行更改,直到它真正起作用 :)。
欢迎所有反馈和想法,以及你是否也感受到了这种痛苦!