HackerNews中文版

51 分•作者: thangqt•9 个月前

Show HN: AI 代码检测器 – 以 95% 的准确率检测 AI 生成的代码

23 分•作者: henryl•9 个月前

嗨 HN，我是 Henry，Span（<a href="https://span.app/" rel="nofollow">https://span.app/</a>）的联合创始人兼首席技术官。今天我们推出了 AI 代码检测器，这是一个可以在浏览器中试用的 AI 代码检测工具。 AI 生成代码的爆炸式增长给工程团队带来了一些奇怪的问题。像 Cursor 和 Copilot 这样的工具几乎被全球每个团队使用——但每个代码生成工具都有其独特的报告使用方式。有些根本不报告使用情况。我们认为，随着 AI 越来越深入地融入我们构建软件的方式，代币消耗将开始与工资支出竞争，因此，了解如何提高熟练程度、提高 ROI 以及分配与 AI 工具相关的资源，将至少与人才方面的并行流程一样重要。真正了解 AI 生成的代码非常困难。然而，这是客户向我们提出的首要问题。所以我们从头开始构建了一种新方法。我们的 AI 代码检测器由 span-detect-1 提供支持，这是一个在数百万 AI 和人工编写的代码样本上训练的、最先进的模型。它可以以 95% 的准确率检测 AI 生成的代码，并将其与已投入生产的特定代码行联系起来。在 Span 平台内，它将使团队清楚地了解 AI 对速度、质量和 ROI 的实际影响。它确实有一些局限性。最值得注意的是，它仅适用于 TypeScript 和 Python 代码。我们正在增加对更多语言的支持：Java、Ruby 和 C# 紧随其后。目前的准确率约为 95%，我们也在努力改进。如果您想试用一下，可以在这里运行一个代码片段 (<a href="https://code-detector.ai/" rel="nofollow">https://code-detector.ai/</a>)，大约五秒钟即可获得结果。我们还有一个更具叙事性的微型网站 (<a href="https://www.span.app/detector" rel="nofollow">https://www.span.app/detector</a>)，我的营销团队说我必须分享。很想听听您的想法，无论是关于工具本身还是您自己的经验。我也会在评论区回答问题。

展示物理学

19 分•作者: pillars•9 个月前

丹麦有望在疫苗推广后根除致癌 HPV 病毒株

108 分•作者: slu•9 个月前

逃逸蛙的妊娠试验蛙在威尔士繁衍了50年

14 分•作者: Luc•9 个月前

Show HN: 具备逻辑的数据，适用于现代 AI 和基础设施工作流

1 分•作者: cj_cummings•9 个月前

Swift 6.2 发布

1 分•作者: peterspath•9 个月前

18 岁 NBC 的资深软件工程师？

1 分•作者: boulangeriee•9 个月前

致所有与我意见相左的人的一封公开信

2 分•作者: djha-skin•9 个月前

北美中世纪餐厅餐垫

1 分•作者: NaOH•9 个月前

镉：适用于部分 RISC 笔记本电脑和 Arm Chromebook 的 Debian Linux 安装程序

1 分•作者: transpute•9 个月前

让火车再次伟大——为了人民和地球

1 分•作者: gnabgib•9 个月前

电子邮件欺骗利用 SPF 和 DMARC：网络安全深度解析

2 分•作者: rolph•9 个月前

如何使用人工智能，而不让自己变笨

2 分•作者: cjbarber•9 个月前

铲屎

1 分•作者: speckx•9 个月前

我解不开的算额难题

18 分•作者: speckx•9 个月前

Launch HN: Rowboat (YC S24) – Rowboat (YC S24) 发布：面向多智能体系统的开源 IDE

25 分•作者: segmenta•9 个月前

大家好，我们是 Arjun、Ramnique 和 Akhilesh，是 Rowboat (<a href="https://www.rowboatlabs.com">https://www.rowboatlabs.com</a>) 的创始人，Rowboat 是一款 AI 辅助 IDE，用于构建和管理带有副驾驶功能的、多智能体系统。使用 Rowboat，您可以构建确定性自动化智能体（例如，自动总结电子邮件）和更具智能性的系统（例如，会议准备助手或客户支持机器人）。以下是一些示例： - 会议准备助手：<a href="https://www.youtube.com/watch?v=KZTP4xZM2DY" rel="nofollow">https://www.youtube.com/watch?v=KZTP4xZM2DY</a> - 客户支持助手：<a href="https://www.youtube.com/watch?v=Xfo-OfgOl8w" rel="nofollow">https://www.youtube.com/watch?v=Xfo-OfgOl8w</a> - Gmail 和 Reddit 助手：<a href="https://www.youtube.com/watch?v=6r7P4Vlcn2g" rel="nofollow">https://www.youtube.com/watch?v=6r7P4Vlcn2g</a> Rowboat 是开源的 (<a href="https://github.com/rowboatlabs/rowboat" rel="nofollow">https://github.com/rowboatlabs/rowboat</a>)，并且拥有一个不断壮大的社区。我们几个月前首次在 Show HN 上发布了它 (<a href="https://news.ycombinator.com/item?id=43763967">https://news.ycombinator.com/item?id=43763967</a>)。今天，我们发布了一项重大更新，并推出了云服务。我们增加了对数百种工具的内置工具集成，例如 Gmail、Github 和 Slack，以及对文档和 URL 的 RAG（检索增强生成），以及根据外部事件触发您的助手的功能。我们的云版本包含开源 IDE 的所有功能，但无需设置或 API 密钥即可立即运行。为了庆祝发布，我们提供 10 美元的 Gemini 模型免费使用额度，这样您就可以立即免费开始构建，而无需添加任何卡片详细信息。付费计划起价为每月 20 美元，您可以访问其他模型（OpenAI、Anthropic、Gemini，更多模型即将推出）和更高的使用限制。越来越多的人认为，某些任务最好由单个智能体处理 (<a href="https://news.ycombinator.com/item?id=45096962">https://news.ycombinator.com/item?id=45096962</a>)，而其他任务则受益于多智能体系统，以获得更高的准确性 (<a href="https://www.anthropic.com/engineering/multi-agent-research-system" rel="nofollow">https://www.anthropic.com/engineering/multi-agent-research-s...</a>)。区别通常归结于范围：像编码这样的专注任务适合单个智能体，但处理多个领域（例如电子邮件、Slack 和 LinkedIn）最好在多个智能体之间分配。多智能体系统也有助于避免上下文污染，因为当 LLM 被要求处理不相关的任务时，它们会失去焦点。此外，清晰地划分职责使每个智能体更容易测试、调试和改进。然而，将工作分配给多个智能体并正确设置它们的提示具有挑战性。OpenAI 和其他公司已经发布了适用于不同场景的模式 (<a href="https://cdn.openai.com/business-guides-and-resources/a-practical-guide-to-building-agents.pdf" rel="nofollow">https://cdn.openai.com/business-guides-and-resources/a-pract...</a>)。我们添加了基于 OpenAI 的 Agents SDK 构建的智能体抽象，以支持这些模式。其中包括面向用户的智能体，它们可以决定在需要时移交给另一个智能体；执行内部任务的任务智能体；以及确定性地调用一系列智能体的管道。 Rowboat 的副驾驶（“Skipper”）了解这些模式，并已预先设置了经过测试的模式，例如用于客户支持机器人的经理-工人设置、用于自动文档摘要的管道以及用于将网络搜索与 RAG 结合的多智能体工作流程。它可以： - 根据高级请求构建多智能体系统，并决定如何在智能体之间分配工作 - 编辑智能体指令，以使用 Composio 工具或任何连接的 MCP 服务器进行正确的工具调用 - 观察您的游乐场聊天，并根据您的测试改进智能体我们将智能体系统视为一个谱系。一端是具有几个 LLM 调用的确定性工作流程。另一端是完全智能化的系统，其中 LLM 做出所有控制流决策——我们专注于谱系的这一端，同时仍然在必要时允许确定性控制，以用于实际的助手用例。我们有意避免了流程图风格的编辑器（如 n8n），因为它们在构建和维护高度智能化的系统时会变得难以操作。我们期待听到您的想法！

滚石、公告牌母公司Penske 控告谷歌，因其 AI 摘要

1 分•作者: speckx•9 个月前

卢旺达推出非洲首辆飞行汽车 [视频]

1 分•作者: simonpure•9 个月前

许多失效的订阅源

1 分•作者: zdw•9 个月前

最新