最新

实数究竟是什么？ (2024)

6 分•作者: EthanHeilman•9 个月前

探索基础模型的工具使用效能

2 分•作者: WorldPeas•9 个月前

Show HN: 我们制作了一个 2.5GB 的离线灾难 AI 助手 [视频]

1 分•作者: inlandrookie•9 个月前

这是 DeepMind 举办的 Gemma 3n Impact 挑战赛的原型。我们之前没有本地 LLM 的经验，所以这是一个非常有趣的学习体验。希望未来能看到更多轻量级的 LLM 模型！

SBoM Workbench v1.19 发布了

1 分•作者: scanosss•9 个月前

SBOM Workbench v1.19 发布了。新功能： • 直接导入原始结果 • 导入带有源代码的项目 • CycloneDX 输出与 Dependency Track 兼容性更好获取地址：https://github.com/scanoss/sbom-workbench/releases/tag/v1.19.0

放置参数

2 分•作者: Bogdanp•9 个月前

我最喜欢的鼠标不到10美元。

2 分•作者: rpgbr•9 个月前

分片不等同于分布式：当 PostgreSQL 不够用时，你需要了解的

1 分•作者: eivanov89•9 个月前

为电力重新构建人工智能

1 分•作者: rbanffy•9 个月前

阿凡达尔：从零开始，用纯粹的强化学习训练语言模型

1 分•作者: haneefmubarak•9 个月前

纯文本工具

1 分•作者: cyb0rg0•9 个月前

科学家们编写高效代码时必须了解的硬件知识

1 分•作者: warrenm•9 个月前

Show HN：通过读者使用情况而非基准测试评估 LLM 的创意写作能力

6 分•作者: Jetwu•9 个月前

嘿，HN！我想找些人来一起玩玩我为了自学 DSPy 而构建的一个小项目！我一直很喜欢阅读小说和网络小说，并且对两件事一直很好奇：基于读者反馈，LLM 如何迭代地学习写得更好，以及哪些 LLM 实际上最擅长创作（研究基准很酷，但并不一定能转化为实际应用）。这正是为什么我构建了 narrator.sh！该平台接受用户输入的小说创意，然后使用 DSPy 逐章生成连载小说，根据真实的读者反馈优化写作。我使用 CoT 和并行模块来分解写作任务，使用精炼模块 + LLM 作为评判员来构建奖励函数，并使用 SIMBA 优化器来重新编译前几章的用户评分，以改进后续章节。我没有使用合成基准，而是跟踪真实的读者指标：阅读时间、评分、书签、评论和回访。这创建了一个排行榜，显示了哪些模型实际上写出了引人入胜的小说，人们想要读完。目前，对创意写作 LLM 最接近的评估来自作者的角度（OpenRouter 对 Novelcrafter 等工具的使用数据）。但最终，读者决定什么是好的，而不是作者。你可以在 <a href="https://narrator.sh" rel="nofollow">https://narrator.sh</a> 试用。这是当前的排行榜：<a href="https://narrator.sh/llm-leaderboard" rel="nofollow">https://narrator.sh/llm-leaderboard</a>（目前还比较空，因为用户不多哈哈）（温馨提示：由于我在 Reddit 上发布了 beta 测试人员，并且人们对提示词的创造力很高，所以有一些成人内容。我正在努力实现内容多样化！）

Axle (YC S22) 正在招聘产品工程师

1 分•作者: niharparikh•9 个月前

美国企业界的有毒闹剧：欢迎来到“炒老板”

1 分•作者: santiix•9 个月前

颜：交互式视频生成的未来已来

1 分•作者: tonyabracadabra•9 个月前

Matrix-Game 2.0：25帧实时交互世界模型

1 分•作者: tonyabracadabra•9 个月前

付不起，也不想付：流媒体服务正将观众推回盗版怀抱

1 分•作者: nemoniac•9 个月前

谷歌找到了规避游说规则的变通方法，避开了高管

1 分•作者: speckx•9 个月前

Show HN: 我“黑”了 Cursor，把它变成了通用 AI 助手

1 分•作者: dabochen•9 个月前

我一直在用 Cursor 处理一些非编码任务，效果非常好。问题在于，VS Code IDE 是为编码设计的，而我需要一个更好的界面来处理那些非编码任务。于是，我构建了几个扩展来添加自定义层： 1. CSV 查看器，用于数据分析，将 csv 文件渲染为可编辑的电子表格。 2. 幻灯片制作器，将 .md 文件渲染为幻灯片，并且可以通过 Cursor 代理创建和编辑。 3. I18n 管理器，将多个翻译文件并排加载到一个表格中，同时 Cursor 通过代理更新翻译。为了让每个人都能使用它，我将核心组件作为工具包开源，可以用来进行 vibe code 你的自定义扩展。它带有一个超级提示模板，通过添加你的需求，你只需一个提示就能获得一个完全可用的扩展。我这样做部分是作为一项实验，看看在 AI 时代，软件分发是否可以让用户在 vibe coding 的帮助下为最后一公里做出贡献。

Bluesky：更新服务条款和政策

1 分•作者: mschuster91•9 个月前

上一页 1...4162 4163 4164 4165 4166...4935 下一页