1 分•作者: howToTestFE•大约 9 小时前
返回首页
一周热榜
1 分•作者: aiman_alsari•大约 9 小时前
1 分•作者: jankar•大约 9 小时前
1 分•作者: ermantrout•大约 8 小时前
1 分•作者: jruohonen•大约 8 小时前
1 分•作者: joegibbs•大约 8 小时前
我进行的一项实验。模型可以访问 E2B 沙盒,并被指示根据规范创建广告(它们可以选择任何它们想使用的工具,例如 Pillow、Chromium),以此来评估它们使用工具、创建其他类型图像、进行复杂布局等的能力。目前 Opus 4.8 位居榜首(这并不令人意外,但它花了 66 个对话轮次才创建出图像),GLM-5.2 位列第五(这确实让我感到惊讶,因为它没有图像能力)。
1 分•作者: Ash_yasuomang•大约 8 小时前
1 分•作者: HellMood•大约 8 小时前
1 分•作者: Tomte•大约 7 小时前
1 分•作者: theanonymousone•大约 7 小时前
1 分•作者: Tycho87•大约 7 小时前
1 分•作者: haeseong•大约 7 小时前
1 分•作者: DivingForGold•大约 6 小时前
需要禁止他们……
1 分•作者: vortex_ape•大约 6 小时前
1 分•作者: tosh•大约 6 小时前
1 分•作者: msolujic•大约 6 小时前
1 分•作者: ahmd•大约 6 小时前
1 分•作者: FlippieFinance•大约 6 小时前
这是我过去几个月一直在进行的一个项目<p>通过XBRL标签从SEC文件中提取了所有美国公司的基本面信息。
1 分•作者: giuliomagnifico•大约 6 小时前
1 分•作者: nisabek•大约 6 小时前