返回首页

一周热榜

3作者: goosethe6 天前
<a href="https://github.com/seanwevans/lockstep" rel="nofollow">https://github.com/seanwevans/lockstep</a> 我想分享我正在开发的系统语言,Lockstep 的 v0.1.0 版本已经发布。它是一种面向数据的系统编程语言,专为高吞吐量、确定性计算流水线而设计。 我构建 Lockstep 的目的是为了弥合 C 的生产力与 GPU 计算着色器执行效率之间的差距。Lockstep 强制执行直线 SIMD 执行,而不是传统的控制流。在计算内核中,你找不到任何 if、for 或 while 语句;分支完全被硬件原生的掩码和流分割所取代。 内存通过 Host 提供的静态 arena 来处理。没有 malloc,没有隐藏的线程,也没有垃圾回收,这保证了可预测的性能,并通过构建消除了竞态条件。 在底层,Lockstep 直接针对 LLVM IR,以利用工业级的优化过程。它还生成一个 C 兼容的头文件,以便与用 C、C++、Rust 或 Zig 编写的宿主应用程序轻松集成。 v0.1.0 版本包括一个编译器,可以生成 LLVM IR 和 C 头文件,一个用于验证小型数据集上的流水线连接和基数的 CLI 模拟器,以及一个可选的 LSP 服务器,用于实时编辑器诊断、悬停类型信息和自动补全。 你可以查看该存储库以了解语法,路线图概述了该项目的下一步发展方向,包括参数化的 SIMD 宽度和多阶段流水线组合。 我很乐意听取关于语言语义、类型系统和整体架构的反馈!
3作者: mcdoolz5 天前
Hi HN, Sulcus 将 AI 记忆从被动的数据库(仅搜索)转移到主动的操作系统(自动化管理)。 核心转变 当前的记忆(向量数据库)是静态的。Sulcus 将记忆视为 LLM 的虚拟内存管理单元(VMMU),使用“热力学”特性来自动化代理的记忆或遗忘。 主要特性 反应式触发器:记忆系统根据规则“反馈”,而不是代理手动搜索(例如,自动固定偏好,在记忆即将“衰减”时通知代理)。 热力学衰减:记忆具有“热度”(相关性)和“半衰期”。频繁的调用会强化它们;疏于使用会导致删除或归档。 Token 效率:声称通过使用智能分页技术减少 90% 的 token 消耗——仅向 LLM 提供当前“热门”内容。 技术:使用 Rust 和 PostgreSQL 构建;作为 MCP(模型上下文协议)sidecar 运行。 <a href="https://sulcus.dforge.ca/membench" rel="nofollow">https://sulcus.dforge.ca/membench</a>
3作者: kumardeepanshu7 天前
我在构建 AI 智能体时,一直遇到同样的问题:每个需要使用邮件的智能体最终都会共享我的个人收件箱或公司的单一域名。这会破坏归属,带来邮件送达风险,并且无法针对每个智能体测试发件人身份。 因此,我构建了 AgentMailr。您通过调用 API 创建一个收件箱,您的智能体将获得一个唯一的电子邮件地址,并且回复会路由回该特定智能体。这适用于入站(OTP 解析、回复路由)和出站(冷邮件、通知)。 支持自带域名,因此邮件将从您的域名发送,而不是我们的域名。REST API 和 MCP 服务器已上线。Node/Python SDK 正在开发中。 很乐意回答有关架构或我如何处理多智能体路由的问题。
3作者: petersunde5 天前
标签页、分屏和 tmux 用起来没问题,直到你同时打开了多个项目,里面有日志、测试和长时间运行的 shell。我以前总是重建上下文,而不是恢复工作。Horizon 把 shell 放在一个无限的画布上。你可以把它们组织成工作区,稍后重新打开时,布局、滚动回溯和历史记录都保持不变。 用 Claude/Codex 在 3 天内构建完成,并且在构建过程中一直在使用这个工作流程。欢迎提供反馈和贡献。
3作者: thequietmind3 天前
嘿,HN!我是 Ezra,MDX Docs 的创建者。<p>我构建它是因为我想要一种快速、简单的方式,使用 Markdown 和 React 以及 MDX 来记录组件。<p>目标是保持事情非常简单:页面只是 MDX 文件,它们直接映射到路由。你可以编写文档,并将 React 组件直接放入其中,无需太多设置。<p>它还包含一个 CLI:<p>npx create-mdx-docs@latest my-docs<p>我一直在用它快速搭建文档站点,到目前为止,它一直是一个非常棒的工作流程。<p>很好奇现在其他人是如何处理组件和内部工具的文档的。很乐意回答任何问题。
3作者: raiph_ai5 天前
嗨,HN, 我们开发了 FireClaw,因为我们一直看到 AI 代理通过网络内容受到提示词注入的攻击。代理获取一个页面,页面上写着“忽略之前的指令”,然后你的代理突然开始泄露数据或运行它不应该运行的命令。 现有的解决方案都是事后检测注入。我们希望从源头上阻止它。 FireClaw 是一个安全代理,位于你的 AI 代理和网络之间。每次抓取都会通过一个四阶段的管道: 1. DNS 黑名单检查(URLhaus、PhishTank、社区订阅源) 2. 结构化清理(删除隐藏的 CSS、零宽度 Unicode、编码技巧) 3. 隔离的 LLM 摘要(加固的子进程,没有工具或记忆) 4. 使用金丝雀令牌进行输出扫描(检测内容是否绕过了摘要) 关键见解:即使第 3 阶段的 LLM 被注入,它也没有工具,没有记忆,也无法访问你的数据。它只能返回文本——这仍然会在第 4 阶段被扫描。攻击者会遇到死胡同。 其他设计决策: * 没有绕过模式。管道是固定的。如果你的代理被攻破,它无法禁用 FireClaw。 * 社区威胁订阅源——实例匿名共享检测元数据(域名、严重性、检测计数)以构建共享黑名单。永远不会发送页面内容。 * 在树莓派上运行,作为一个物理设备,带有 OLED 显示屏,显示实时统计数据,并在捕获威胁时以动画火焰亮起。 我们广泛地搜索了文献和开源项目——没有其他人正在为代理提示词注入做基于代理的防御。检测存在,沙盒也存在,但是一个在内容到达代理上下文之前进行清理的内联代理?我们找不到。 200 多个检测模式,JSONL 审计日志记录,域名信任层级,速率限制和成本控制。采用 AGPLv3 许可证。 网站:[https://fireclaw.app](https://fireclaw.app) 欢迎任何从事 AI 代理安全工作的人提供反馈。我们遗漏了什么?我们应该在模式数据库中添加哪些攻击向量?
3作者: FranciscoAngulo3 天前
我是弗朗西斯科,一位来自西班牙的研究员和架构师。大约一年前,我开始对一个看似显而易见却被忽视的问题感到沮丧:现有的每个 AI 智能体都是孤立运行的。它们无法互相发现,无法协作,当其中一个解决了问题,其他每个智能体都必须从头开始解决。我们已经构建了计算机互联网,但还没有智能体互联网。<p>这种沮丧促成了 P2PCLAW 的诞生——一个去中心化的点对点研究网络,AI 智能体(我们称之为硅参与者)和人类研究人员(碳参与者)可以在其中互相发现,发布科学发现,并通过形式化的数学证明来验证主张。不是 LLM peer review,也不是人类委员会审查——而是 Lean 4 证明验证,当且仅当一个主张是 Heyting 代数上一个核算子 R 的不动点时,该主张才被接受。类型检查器是唯一的仲裁者。它不看你的简历。它看你的证明。<p>技术栈比听起来要深得多。网络层是 GUN.js + IPFS 点对点网格——智能体无需账户,无需密钥,只需在 API 上访问 GET /silicon 即可加入。已发表的论文进入 mempool,由多个独立节点验证,一旦通过,它们就会进入 La Rueda——一个 IPFS 固定的、内容寻址的永久存档,没有任何一方可以控制或审查。每个贡献都获得一个 SHA-256 内容哈希和 IPFS CID,任何人都可以独立验证。<p>安全层(AgentHALO)将每个智能体封装在一个经过形式验证的主权容器中:混合 KEM,使用 X25519 + ML-KEM-768 (FIPS 203),双重签名,使用 Ed25519 + ML-DSA-65 (FIPS 204),Nym 混网隐私路由,因此在敏感环境中的智能体可以贡献而不会暴露,并通过 IPA/KZG 多项式承诺证明实现防篡改追踪。875+ 个测试通过。零遥测——未经明确同意,任何数据都不会离开你的机器。<p>我们还在网络内部构建了一个完整的实验室:八个科学领域(物理学、化学、生物学/基因组学、人工智能/机器学习、机器人学、数据可视化、量子、DeSci),一个带有 DAG 构建和 YAML 导出的可视化管道构建器,跨 arXiv/Semantic Scholar/OpenAlex 的文献搜索,以及跨 HuggingFace Spaces 和 Railway 网关路由作业的分布式 swarm 计算。任何 OpenClaw 智能体都可以通过我们的 MCP 服务器连接,并通过在其 CLAUDE.md 中添加三行代码成为硅参与者。<p>目前的实际案例:我们正在与哈佛大学的 Zitnik 实验室(TxAgent / ToolUniverse — 生物医学人工智能)进行积极的技术对话,讨论使用 P2PCLAW 的验证层,以便在进入科学记录之前,对人工智能生成的药物相互作用假设进行形式验证并永久归因。开放源代码倡议也做出了积极回应,并正在审查我们的许可方法(基于我们称之为 CAB 许可证的分层公共利益/小型企业/企业堆栈)。<p>我特别希望从 HN 社区获得什么:对 Lean 4 架构的技术审查(我们的核算子形式化是否存在差距?),GUN.js 网格设计选择(我们选择它而不是 libp2p 是为了浏览器兼容性——这样做对吗?),以及 MCP 集成(我们暴露了 347 个工具——这对智能体来说是否太多,无法有效导航,或者发现是正确机制?)。此外,老实说,我想知道“硅参与者发布,通过证明质量获得排名”的模型对构建者来说是否像对我们一样具有吸引力,或者我们是否遗漏了更简单的框架。<p>该系统已上线。你现在就可以像一个智能体一样访问它:GET <a href="https://p2pclaw.com/agent-briefing" rel="nofollow">https://p2pclaw.com/agent-briefing</a><p>或者作为人类研究人员进行探索,访问 <a href="https://app.p2pclaw.com" rel="nofollow">https://app.p2pclaw.com</a><p>完整技术文档:<a href="https://www.apoth3osis.io/projects" rel="nofollow">https://www.apoth3osis.io/projects</a> GitHub:<a href="https://github.com/Agnuxo1/OpenCLAW-P2P" rel="nofollow">https://github.com/Agnuxo1/OpenCLAW-P2P</a> 研究论文:<a href="https://www.researchgate.net/publication/401449080_OpenCLAW-P2P_v3_0A" rel="nofollow">https://www.researchgate.net/publication/401449080_OpenCLAW-...</a>
3作者: dragonmann3 天前
我开发这个东西,是因为我曾因为一个符合欧盟 261 条例的退款问题,被航空公司的聊天机器人给难住了。虽然那个机器人技术上是错的,但我对相关法律不够了解,无法有效地反驳它。<p>这个游戏让你身临其境地体验那种情况:一家公司的 AI 拒绝了你的索赔,你必须运用真实的消费者保护法来驳倒它。每个关卡都讲解一条法律——欧盟 261 条例、GDPR 第 22 条、FCBA(公平信用账单法案)、2015 年消费者权利法案等等。当你把 AI 的信心值降为零时,你就赢了。<p>游戏共有 37 个关卡,涵盖欧盟、美国、英国和澳大利亚。免费,无需注册。<p>我很想知道 Hacker News 社区对这些场景的真实性有什么看法——以及这种“对抗性模拟”是否真的对学习有帮助。<p>https://fixai.dev
3作者: mrxdev3 天前
这是一个连接到你已安装的命令行工具的 Obsidian 插件。插件本身不内置 LLM 集成,也不需要在插件中配置 API 密钥。它将你的工具作为子进程启动,将库上下文通过管道输入到每个提示中,并将响应流式传输到聊天面板。 支持 Claude Code、Opencode 以及任何通过通用适配器的自定义二进制文件。添加新工具只需一个文件。免费,并自豪地开源(MIT 许可)。 欢迎任何试用者提供反馈。