5作者: Paster335大约 1 个月前
最近我们大量使用了后台 Claude 循环,结果我们醒来时发现提交的 PR(Pull Request)并没有解决我们想要的问题,而且是基于错误的假设。此外,代理编写的测试通常是同义反复的,并没有真正测试意图。我们想要一个能够利用公司所有上下文信息,并编写测试来检查产品正确性的代理。 例如,我们从事监管科技领域,所以 bug 不总是技术性的。我们经常遇到的情况是,本应触发的内幕交易警报却未触发。我们想要一个能够将法律法规转化为测试的代理。 目前,用户可以上传 PDF、MD、TXT 和 DOCX 文件,但我们计划未来集成 Slack、Notion、Linear 和 Zoom 等。 我们还处于早期阶段,非常希望听到大家的想法!