一周热榜

我想创建一个 LLM 游戏基准测试，充分展现这一代前沿 LLM 的顶级技能——编码。十年前，一个团队发布了一款名为 Screeps 的游戏。它被描述为“程序员的 MMO RTS 沙盒”。在 Screeps 中，人类玩家编写 JavaScript 策略，这些策略在游戏环境中执行。 Screeps 的范式，即编写代码并在实时游戏环境中执行，非常适合 LLM 基准测试。借鉴 Screeps 开源 API 的一个版本，LLM Skirmish 让 LLM 在一系列 1v1 实时战略游戏中正面交锋。此外，还有一个社区排行榜，您可以在其中选择您喜欢的 LLM，并提交您自己的游戏策略，与其他社区成员一较高下。

Show HN: Knowns – 赋予你的 AI 持久的工程记忆

1 分•作者: howznguyen•1 天前

本地访问 vs. 边缘计算

1 分•作者: asadk•1 天前

在基于 RAG 的产品中，将文档视为可观测系统

1 分•作者: alex_fash•1 天前

Claude 代码已崩溃

1 分•作者: vintagedave•1 天前

Show HN: 用 AI 将模糊的想法转化为可构建的方案

1 分•作者: schart01•1 天前

我们开发 INVENT 的初衷，是看到团队在开发开始前就面临重重困难——这并非因为他们缺乏技能，而是因为早期的规划仍然是手动、零散的，并且充满了未解之谜。 INVENT 使用引导式 AI 面试，将早期的模糊不清转化为清晰、可执行的成果。如果你是一位创始人、产品经理或工程师，也曾经历过这种痛苦，我很乐意听取你的反馈。

Show HN: Vesper – 当 AI 设计自己的记忆系统时会发生什么

1 分•作者: fitz2882•1 天前

最贵和最便宜的超市

1 分•作者: speckx•1 天前

Pip 已经不再是 PyPI 上下载量最高的软件包了。

1 分•作者: zahlman•1 天前

美国移民及海关执法局（ICE）开始在美国各地购置“巨型”仓库式拘留中心

1 分•作者: Flip-per•1 天前

上一页 1...85 86 87 88 89...104 下一页