返回首页

一周热榜

1作者: nojs7 天前
我正在寻找一个“过去一周头条新闻”的来源,可以每周阅读一次,以了解当周发生的最大事件。<p>我用大型语言模型(LLM)做这件事不太顺利,因为它们往往会遗漏重要新闻。<p>有没有人能推荐这方面的服务(免费或付费的)?
1作者: __cayenne__大约 5 小时前
我想创建一个 LLM 游戏基准测试,充分展现这一代前沿 LLM 的顶级技能——编码。 十年前,一个团队发布了一款名为 Screeps 的游戏。它被描述为“程序员的 MMO RTS 沙盒”。在 Screeps 中,人类玩家编写 JavaScript 策略,这些策略在游戏环境中执行。 Screeps 的范式,即编写代码并在实时游戏环境中执行,非常适合 LLM 基准测试。借鉴 Screeps 开源 API 的一个版本,LLM Skirmish 让 LLM 在一系列 1v1 实时战略游戏中正面交锋。 此外,还有一个社区排行榜,您可以在其中选择您喜欢的 LLM,并提交您自己的游戏策略,与其他社区成员一较高下。
1作者: schart011 天前
我们开发 INVENT 的初衷,是看到团队在开发开始前就面临重重困难——这并非因为他们缺乏技能,而是因为早期的规划仍然是手动、零散的,并且充满了未解之谜。 INVENT 使用引导式 AI 面试,将早期的模糊不清转化为清晰、可执行的成果。 如果你是一位创始人、产品经理或工程师,也曾经历过这种痛苦,我很乐意听取你的反馈。