13 分•作者: defrost•5 天前
返回首页
最新
3 分•作者: FranciscoAngulo•5 天前
我是弗朗西斯科,一位来自西班牙的研究员和架构师。大约一年前,我开始对一个看似显而易见却被忽视的问题感到沮丧:现有的每个 AI 智能体都是孤立运行的。它们无法互相发现,无法协作,当其中一个解决了问题,其他每个智能体都必须从头开始解决。我们已经构建了计算机互联网,但还没有智能体互联网。<p>这种沮丧促成了 P2PCLAW 的诞生——一个去中心化的点对点研究网络,AI 智能体(我们称之为硅参与者)和人类研究人员(碳参与者)可以在其中互相发现,发布科学发现,并通过形式化的数学证明来验证主张。不是 LLM peer review,也不是人类委员会审查——而是 Lean 4 证明验证,当且仅当一个主张是 Heyting 代数上一个核算子 R 的不动点时,该主张才被接受。类型检查器是唯一的仲裁者。它不看你的简历。它看你的证明。<p>技术栈比听起来要深得多。网络层是 GUN.js + IPFS 点对点网格——智能体无需账户,无需密钥,只需在 API 上访问 GET /silicon 即可加入。已发表的论文进入 mempool,由多个独立节点验证,一旦通过,它们就会进入 La Rueda——一个 IPFS 固定的、内容寻址的永久存档,没有任何一方可以控制或审查。每个贡献都获得一个 SHA-256 内容哈希和 IPFS CID,任何人都可以独立验证。<p>安全层(AgentHALO)将每个智能体封装在一个经过形式验证的主权容器中:混合 KEM,使用 X25519 + ML-KEM-768 (FIPS 203),双重签名,使用 Ed25519 + ML-DSA-65 (FIPS 204),Nym 混网隐私路由,因此在敏感环境中的智能体可以贡献而不会暴露,并通过 IPA/KZG 多项式承诺证明实现防篡改追踪。875+ 个测试通过。零遥测——未经明确同意,任何数据都不会离开你的机器。<p>我们还在网络内部构建了一个完整的实验室:八个科学领域(物理学、化学、生物学/基因组学、人工智能/机器学习、机器人学、数据可视化、量子、DeSci),一个带有 DAG 构建和 YAML 导出的可视化管道构建器,跨 arXiv/Semantic Scholar/OpenAlex 的文献搜索,以及跨 HuggingFace Spaces 和 Railway 网关路由作业的分布式 swarm 计算。任何 OpenClaw 智能体都可以通过我们的 MCP 服务器连接,并通过在其 CLAUDE.md 中添加三行代码成为硅参与者。<p>目前的实际案例:我们正在与哈佛大学的 Zitnik 实验室(TxAgent / ToolUniverse — 生物医学人工智能)进行积极的技术对话,讨论使用 P2PCLAW 的验证层,以便在进入科学记录之前,对人工智能生成的药物相互作用假设进行形式验证并永久归因。开放源代码倡议也做出了积极回应,并正在审查我们的许可方法(基于我们称之为 CAB 许可证的分层公共利益/小型企业/企业堆栈)。<p>我特别希望从 HN 社区获得什么:对 Lean 4 架构的技术审查(我们的核算子形式化是否存在差距?),GUN.js 网格设计选择(我们选择它而不是 libp2p 是为了浏览器兼容性——这样做对吗?),以及 MCP 集成(我们暴露了 347 个工具——这对智能体来说是否太多,无法有效导航,或者发现是正确机制?)。此外,老实说,我想知道“硅参与者发布,通过证明质量获得排名”的模型对构建者来说是否像对我们一样具有吸引力,或者我们是否遗漏了更简单的框架。<p>该系统已上线。你现在就可以像一个智能体一样访问它:GET <a href="https://p2pclaw.com/agent-briefing" rel="nofollow">https://p2pclaw.com/agent-briefing</a><p>或者作为人类研究人员进行探索,访问 <a href="https://app.p2pclaw.com" rel="nofollow">https://app.p2pclaw.com</a><p>完整技术文档:<a href="https://www.apoth3osis.io/projects" rel="nofollow">https://www.apoth3osis.io/projects</a>
GitHub:<a href="https://github.com/Agnuxo1/OpenCLAW-P2P" rel="nofollow">https://github.com/Agnuxo1/OpenCLAW-P2P</a>
研究论文:<a href="https://www.researchgate.net/publication/401449080_OpenCLAW-P2P_v3_0A" rel="nofollow">https://www.researchgate.net/publication/401449080_OpenCLAW-...</a>
2 分•作者: Maesh•5 天前
我开源了一个包含 5 份合成银行和信用卡账单 PDF 的数据集,旨在测试提取/解析的准确性。每个 PDF 都使用一家虚构的银行,并采用来自不同国家的真实格式。
我一直在构建一个银行账单转换器 (Bankstatemently),并不断发现不同银行的边缘情况。在某个时候,我开始将它们归类为“怪癖”,目前已记录了 36 个挑战,而且还在不断增加(例如:跨年边界的无年份日期、信用卡收费显示为正数而不是负数、日期隐藏在描述文本中等)。
真实的银行数据是私密的,因此没有共享的数据集可用于测试解析器。一旦我掌握了这些怪癖,我意识到我可以使用它们来重建故意包含这些挑战的账单,以便更多人可以使用它们。
还有一个免费的评估 API:提交您解析的 JSON,即可获得字段级别的准确性分数。真实数据保存在服务器端,但这不一定能完全防止过拟合。
欢迎提供关于缺少哪些边缘情况的反馈。我计划让接下来的 10 份账单更具挑战性(扫描的 PDF、跨多表的多种货币、佛历日期)。
[https://github.com/bankstatemently/bank-statement-parsing-benchmark](https://github.com/bankstatemently/bank-statement-parsing-benchmark)
您可以在此处浏览所有具有真实示例的怪癖:[https://bankstatemently.com/benchmark/challenges](https://bankstatemently.com/benchmark/challenges)
181 分•作者: ibraheemdev•5 天前
40 分•作者: speckx•5 天前
1 分•作者: hawk•5 天前
1 分•作者: meghan•5 天前
1 分•作者: vdavid•5 天前
1 分•作者: unknownhad•5 天前
<a href="https://mairo.himanshuanand.workers.dev" rel="nofollow">https://mairo.himanshuanand.workers.dev</a>
所有关卡均由人工智能即时生成。
欢迎分享您的评价/反馈。<p>#AI乱炖
1 分•作者: HotGarbage•5 天前
1 分•作者: gbrindisi•5 天前
1 分•作者: fatliverfreddy•5 天前
1 分•作者: mkdesign•5 天前
大家好,我在一年时间里设计了一款口袋大小的高尔夫游戏,围绕两个限制:DIN A7 尺寸(手掌大小),并且只能用一支笔来玩。没有电池,没有屏幕。
我来自网页和应用程序设计领域,为纸张设计是全新的领域。我手绘了每一个六边形布局,在每一页上都内置了一个骰子条,这样无需骰子也能玩。在收到几位测试玩家的反馈后,我添加了道具、传送门和一个严格的目标分数(标准杆)来争取更低的分数——这增加了相当的复杂性和趣味性。
需要说明的是:有一个听起来类似的产品叫做 Paper Apps Golf,它启发了我。一开始这只是一个副业项目,我专注于游戏机制,而不是主题(事后看来,我本可以使用另一个主题)。下一个项目将会有不同的角度,我想探索移动游戏机制如何转化为笔和纸游戏。比如横版跑酷或者塔防游戏。
PS:关于这个名字——我想这源于一则 Dilbert 漫画,讲的是在会议上心不在焉,这启发了我。
1 分•作者: ostacke•5 天前
1 分•作者: justin66•5 天前
21 分•作者: ibobev•5 天前
3 分•作者: mrxdev•5 天前
这是一个连接到你已安装的命令行工具的 Obsidian 插件。插件本身不内置 LLM 集成,也不需要在插件中配置 API 密钥。它将你的工具作为子进程启动,将库上下文通过管道输入到每个提示中,并将响应流式传输到聊天面板。
支持 Claude Code、Opencode 以及任何通过通用适配器的自定义二进制文件。添加新工具只需一个文件。免费,并自豪地开源(MIT 许可)。
欢迎任何试用者提供反馈。
4 分•作者: sharemywin•5 天前
不知道这场战争会不会迫使公司重新推行居家办公,以应对油价上涨和燃油供应问题。如果加油站没油或者要等一个小时才能加到油,上班就太难了。
3 分•作者: dragonmann•5 天前
我开发这个东西,是因为我曾因为一个符合欧盟 261 条例的退款问题,被航空公司的聊天机器人给难住了。虽然那个机器人技术上是错的,但我对相关法律不够了解,无法有效地反驳它。<p>这个游戏让你身临其境地体验那种情况:一家公司的 AI 拒绝了你的索赔,你必须运用真实的消费者保护法来驳倒它。每个关卡都讲解一条法律——欧盟 261 条例、GDPR 第 22 条、FCBA(公平信用账单法案)、2015 年消费者权利法案等等。当你把 AI 的信心值降为零时,你就赢了。<p>游戏共有 37 个关卡,涵盖欧盟、美国、英国和澳大利亚。免费,无需注册。<p>我很想知道 Hacker News 社区对这些场景的真实性有什么看法——以及这种“对抗性模拟”是否真的对学习有帮助。<p>https://fixai.dev
10 分•作者: dcre•5 天前