23作者: henryl9 个月前
嗨 HN, 我是 Henry,Span(<a href="https://span.app/" rel="nofollow">https://span.app/</a>)的联合创始人兼首席技术官。今天我们推出了 AI 代码检测器,这是一个可以在浏览器中试用的 AI 代码检测工具。 AI 生成代码的爆炸式增长给工程团队带来了一些奇怪的问题。像 Cursor 和 Copilot 这样的工具几乎被全球每个团队使用——但每个代码生成工具都有其独特的报告使用方式。有些根本不报告使用情况。 我们认为,随着 AI 越来越深入地融入我们构建软件的方式,代币消耗将开始与工资支出竞争,因此,了解如何提高熟练程度、提高 ROI 以及分配与 AI 工具相关的资源,将至少与人才方面的并行流程一样重要。 真正了解 AI 生成的代码非常困难。然而,这是客户向我们提出的首要问题。 所以我们从头开始构建了一种新方法。 我们的 AI 代码检测器由 span-detect-1 提供支持,这是一个在数百万 AI 和人工编写的代码样本上训练的、最先进的模型。它可以以 95% 的准确率检测 AI 生成的代码,并将其与已投入生产的特定代码行联系起来。在 Span 平台内,它将使团队清楚地了解 AI 对速度、质量和 ROI 的实际影响。 它确实有一些局限性。最值得注意的是,它仅适用于 TypeScript 和 Python 代码。我们正在增加对更多语言的支持:Java、Ruby 和 C# 紧随其后。目前的准确率约为 95%,我们也在努力改进。 如果您想试用一下,可以在这里运行一个代码片段 (<a href="https://code-detector.ai/" rel="nofollow">https://code-detector.ai/</a>),大约五秒钟即可获得结果。我们还有一个更具叙事性的微型网站 (<a href="https://www.span.app/detector" rel="nofollow">https://www.span.app/detector</a>),我的营销团队说我必须分享。 很想听听您的想法,无论是关于工具本身还是您自己的经验。我也会在评论区回答问题。
1作者: speckx9 个月前
25作者: segmenta9 个月前
大家好,我们是 Arjun、Ramnique 和 Akhilesh,是 Rowboat (<a href="https://www.rowboatlabs.com">https://www.rowboatlabs.com</a>) 的创始人,Rowboat 是一款 AI 辅助 IDE,用于构建和管理带有副驾驶功能的、多智能体系统。使用 Rowboat,您可以构建确定性自动化智能体(例如,自动总结电子邮件)和更具智能性的系统(例如,会议准备助手或客户支持机器人)。 以下是一些示例: - 会议准备助手:<a href="https://www.youtube.com/watch?v=KZTP4xZM2DY" rel="nofollow">https://www.youtube.com/watch?v=KZTP4xZM2DY</a> - 客户支持助手:<a href="https://www.youtube.com/watch?v=Xfo-OfgOl8w" rel="nofollow">https://www.youtube.com/watch?v=Xfo-OfgOl8w</a> - Gmail 和 Reddit 助手:<a href="https://www.youtube.com/watch?v=6r7P4Vlcn2g" rel="nofollow">https://www.youtube.com/watch?v=6r7P4Vlcn2g</a> Rowboat 是开源的 (<a href="https://github.com/rowboatlabs/rowboat" rel="nofollow">https://github.com/rowboatlabs/rowboat</a>),并且拥有一个不断壮大的社区。我们几个月前首次在 Show HN 上发布了它 (<a href="https://news.ycombinator.com/item?id=43763967">https://news.ycombinator.com/item?id=43763967</a>)。 今天,我们发布了一项重大更新,并推出了云服务。我们增加了对数百种工具的内置工具集成,例如 Gmail、Github 和 Slack,以及对文档和 URL 的 RAG(检索增强生成),以及根据外部事件触发您的助手的功能。 我们的云版本包含开源 IDE 的所有功能,但无需设置或 API 密钥即可立即运行。为了庆祝发布,我们提供 10 美元的 Gemini 模型免费使用额度,这样您就可以立即免费开始构建,而无需添加任何卡片详细信息。付费计划起价为每月 20 美元,您可以访问其他模型(OpenAI、Anthropic、Gemini,更多模型即将推出)和更高的使用限制。 越来越多的人认为,某些任务最好由单个智能体处理 (<a href="https://news.ycombinator.com/item?id=45096962">https://news.ycombinator.com/item?id=45096962</a>),而其他任务则受益于多智能体系统,以获得更高的准确性 (<a href="https://www.anthropic.com/engineering/multi-agent-research-system" rel="nofollow">https://www.anthropic.com/engineering/multi-agent-research-s...</a>)。 区别通常归结于范围:像编码这样的专注任务适合单个智能体,但处理多个领域(例如电子邮件、Slack 和 LinkedIn)最好在多个智能体之间分配。多智能体系统也有助于避免上下文污染,因为当 LLM 被要求处理不相关的任务时,它们会失去焦点。此外,清晰地划分职责使每个智能体更容易测试、调试和改进。 然而,将工作分配给多个智能体并正确设置它们的提示具有挑战性。OpenAI 和其他公司已经发布了适用于不同场景的模式 (<a href="https://cdn.openai.com/business-guides-and-resources/a-practical-guide-to-building-agents.pdf" rel="nofollow">https://cdn.openai.com/business-guides-and-resources/a-pract...</a>)。我们添加了基于 OpenAI 的 Agents SDK 构建的智能体抽象,以支持这些模式。其中包括面向用户的智能体,它们可以决定在需要时移交给另一个智能体;执行内部任务的任务智能体;以及确定性地调用一系列智能体的管道。 Rowboat 的副驾驶(“Skipper”)了解这些模式,并已预先设置了经过测试的模式,例如用于客户支持机器人的经理-工人设置、用于自动文档摘要的管道以及用于将网络搜索与 RAG 结合的多智能体工作流程。它可以: - 根据高级请求构建多智能体系统,并决定如何在智能体之间分配工作 - 编辑智能体指令,以使用 Composio 工具或任何连接的 MCP 服务器进行正确的工具调用 - 观察您的游乐场聊天,并根据您的测试改进智能体 我们将智能体系统视为一个谱系。一端是具有几个 LLM 调用的确定性工作流程。另一端是完全智能化的系统,其中 LLM 做出所有控制流决策——我们专注于谱系的这一端,同时仍然在必要时允许确定性控制,以用于实际的助手用例。我们有意避免了流程图风格的编辑器(如 n8n),因为它们在构建和维护高度智能化的系统时会变得难以操作。 我们期待听到您的想法!