1 分•作者: speckx•1 天前
返回首页
一周热榜
1 分•作者: wslh•1 天前
1 分•作者: doener•7 天前
1 分•作者: belter•7 天前
1 分•作者: nojs•7 天前
我正在寻找一个“过去一周头条新闻”的来源,可以每周阅读一次,以了解当周发生的最大事件。<p>我用大型语言模型(LLM)做这件事不太顺利,因为它们往往会遗漏重要新闻。<p>有没有人能推荐这方面的服务(免费或付费的)?
1 分•作者: ogogmad•7 天前
1 分•作者: ViktorRay•7 天前
1 分•作者: doener•7 天前
1 分•作者: robin_reala•大约 5 小时前
1 分•作者: tacheiordache•7 天前
1 分•作者: __cayenne__•大约 5 小时前
我想创建一个 LLM 游戏基准测试,充分展现这一代前沿 LLM 的顶级技能——编码。
十年前,一个团队发布了一款名为 Screeps 的游戏。它被描述为“程序员的 MMO RTS 沙盒”。在 Screeps 中,人类玩家编写 JavaScript 策略,这些策略在游戏环境中执行。
Screeps 的范式,即编写代码并在实时游戏环境中执行,非常适合 LLM 基准测试。借鉴 Screeps 开源 API 的一个版本,LLM Skirmish 让 LLM 在一系列 1v1 实时战略游戏中正面交锋。
此外,还有一个社区排行榜,您可以在其中选择您喜欢的 LLM,并提交您自己的游戏策略,与其他社区成员一较高下。
1 分•作者: howznguyen•1 天前
1 分•作者: asadk•1 天前
1 分•作者: alex_fash•1 天前
1 分•作者: vintagedave•1 天前
1 分•作者: schart01•1 天前
我们开发 INVENT 的初衷,是看到团队在开发开始前就面临重重困难——这并非因为他们缺乏技能,而是因为早期的规划仍然是手动、零散的,并且充满了未解之谜。
INVENT 使用引导式 AI 面试,将早期的模糊不清转化为清晰、可执行的成果。
如果你是一位创始人、产品经理或工程师,也曾经历过这种痛苦,我很乐意听取你的反馈。
1 分•作者: fitz2882•1 天前
1 分•作者: speckx•1 天前
1 分•作者: zahlman•1 天前
1 分•作者: Flip-per•1 天前