3作者: scfast9 个月前
嗨,HN, 我一直在开发一个名为 *Testronaut* 的项目,这是一个自主测试框架,它结合了 AI 推理和真实的浏览器自动化。 它的理念是让你用简单的英语将端到端测试定义为“任务”,然后让一个代理使用 Playwright 通过真实的浏览器运行它们。 我为什么构建它:我经常发现端到端测试很脆弱,维护起来耗时,而且难以扩展。 Testronaut 尝试通过使用 AI 使测试适应小的 UI 更改来减少维护负担,同时仍然生成关于通过/失败的确定性报告。 工作原理: - 任务可以写成字符串或函数。 - 代理使用 GPT-4o 和一组工具(点击、输入、导航、获取 DOM 等)与页面交互。 正在支持其他 LLM/模型。 - 浏览器控制由 Playwright 处理。 - 报告以 JSON 和 HTML 格式生成,并附有分步分解(包括截图)。 - 它通过 CLI (`npx testronaut`) 在本地运行,不需要任何托管服务。 但是,你需要提供自己的 OpenAI API 密钥。 当前状态: - 早期阶段:它适用于简单的流程和演示应用程序,但我仍在调整可靠性和效率。 - 它通过一个命令安装,并附带一个示例任务。 - 在 npm/GitHub 上开源。 链接: - 文档和快速入门:<a href="https://docs.testronaut.app" rel="nofollow">https://docs.testronaut.app</a> - GitHub:<a href="https://github.com/mission-testronaut/testronaut-cli" rel="nofollow">https://github.com/mission-testronaut/testronaut-cli</a> - npm:<a href="https://www.npmjs.com/package/testronaut" rel="nofollow">https://www.npmjs.com/package/testronaut</a> 我很乐意收到 HN 社区的反馈: - 这在哪些方面最有用(CI/CD?替换不稳定的测试?探索性测试?)。 - 你对使用 AI 驱动的测试运行器有什么担忧。 - 在早期采用中我应该注意哪些“陷阱”。 感谢你的关注!
1作者: sifterai9 个月前
在厌倦了为简单的 CSV 任务编写 pandas 脚本后,我构建了这个工具。<p>上传一个文件,用通俗易懂的英语描述你的需求: - “筛选销售额大于 1000 的数据,并按地区分组” - “按渠道计算 ROI 并进行排名” - “删除重复项并按日期排序”<p>几秒钟内就能得到干净的 CSV/TSV 文件。<p>有没有其他人也发现自己经常进行重复的数据转换,这些转换太小,不值得编写完整的脚本,但手动操作又太繁琐?<p>访问地址:sifter-ai.com
2作者: sathishn9 个月前
获得反向链接通常感觉很麻烦——冷冰冰的邮件、电子表格、链接消失,以及垃圾链接。<p>我正在试验一个基于积分的系统,其中:<p>1. 网站提供反向链接并赚取积分。 2. 它们可以用积分从其他网站获得反向链接,而不仅仅是同一个网站。 3. 平台自动验证链接是否有效。<p>这个想法是,产品创作者和企业可以通过链接到他们已经认为有用和值得信赖的内容来互相支持——不是垃圾交换,而是真正的推荐。<p>我的问题是:<p>你认为这在 2025 年是一个真正的问题吗?<p>基于积分的系统真的有效吗,还是在实践中会崩溃?
1作者: acofranc9 个月前
我做了一个网站,灵感来源于一个荒谬的副业:一本给成年人看的翻翻书。 它混合了科学事实、(糟糕的)诗歌,以及过多的关于丁丁的知识。 内容略带 NSFW(不宜在工作场合浏览),具有互动性,绝对出乎你的意料。
1作者: paulmbw9 个月前
大家好,我是 Traceprompt 的创始人 Paul。我们正在构建一个开源 SDK,用于封装您的 AI 代理,并生成防篡改的审计跟踪,这样您就可以证明哪个代理在何时使用了哪个模型做了什么。<p>您可以查看 Node SDK(更多语言即将推出):<a href="https:&#x2F;&#x2F;github.com&#x2F;traceprompt&#x2F;traceprompt-node" rel="nofollow">https:&#x2F;&#x2F;github.com&#x2F;traceprompt&#x2F;traceprompt-node</a><p>我们构建 Traceprompt 是因为 LLM 被广泛使用,但缺乏明确的审计和合规计划。通过与开发人员的研究和讨论,我经常看到金融科技和医疗保健团队手动拼凑 API 网关、CloudWatch Logs 和 S3 存储桶来跟踪提示/响应和保留。这既复杂又昂贵,因为几乎没有不可变的证据。目前大多数工具(Langfuse、Heliclone 等)都侧重于 LLM 可观察性;很少有工具能帮助生成可验证的合规性证据。这就是我们的用武之地。<p>此外,法规也在朝着这个方向发展(例如,欧盟人工智能法案要求对某些高风险系统进行日志记录,HIPAA 要求进行审计控制,FINRA/SEC 规则推动 WORM 风格的保留)。我们的目标是让“证明没有改变”变得简单。<p>我们的 SDK 很简单:<p>1. 使用 AWS KMS 的自带密钥(BYOK)架构。我们从不查看明文提示/响应;只有您才能解密。其他 KMS 提供商正在规划中。<p>2. 仅追加、哈希链式日志,并带有公共 Merkle 锚点,用于独立验证。代码库:<a href="https:&#x2F;&#x2F;github.com&#x2F;traceprompt&#x2F;open-anchors" rel="nofollow">https:&#x2F;&#x2F;github.com&#x2F;traceprompt&#x2F;open-anchors</a><p>3. 审计包:当有人问“在这一天和时间到底发生了什么”时,导出 CSV 行和证明(以及收据)。您还可以验证审计包——如果一个坏人更改了一个字节或删除了某一行,验证就会失败。<p>如果“AI 审计跟踪”是您关注或规划的内容,我很乐意与您交流。有几种方法可以开始:<p>1. 检查代码库:查看代码,安装 SDK 并进行实验;如果出现任何问题,请提交问题——<a href="https:&#x2F;&#x2F;github.com&#x2F;traceprompt&#x2F;traceprompt-node" rel="nofollow">https:&#x2F;&#x2F;github.com&#x2F;traceprompt&#x2F;traceprompt-node</a> + <a href="https:&#x2F;&#x2F;github.com&#x2F;traceprompt&#x2F;open-anchors" rel="nofollow">https:&#x2F;&#x2F;github.com&#x2F;traceprompt&#x2F;open-anchors</a><p>2. 登陆页面:<a href="https:&#x2F;&#x2F;traceprompt.com" rel="nofollow">https:&#x2F;&#x2F;traceprompt.com</a>——有关集成和定价的详细信息;7 天免费试用(或 200 万个 token 限制)。<p>3. 加入我们的 Discord:<a href="https:&#x2F;&#x2F;discord.gg&#x2F;2yUSXDECQk" rel="nofollow">https:&#x2F;&#x2F;discord.gg&#x2F;2yUSXDECQk</a><p>4. 预约 30 分钟的免费演示通话:<a href="https:&#x2F;&#x2F;cal.com&#x2F;traceprompt&#x2F;traceprompt-intro" rel="nofollow">https:&#x2F;&#x2F;cal.com&#x2F;traceprompt&#x2F;traceprompt-intro</a><p>我们很乐意听取您的反馈,所以我们会在评论区!如果您是开发人员,我很乐意深入探讨更多技术细节或回答任何问题。如果您从事 AI 审计和合规领域,请与我们联系,因为我们有很多东西需要学习和探索 :)<p>谢谢!