6 分•作者: EthanHeilman•9 个月前
返回首页
最新
2 分•作者: WorldPeas•9 个月前
1 分•作者: inlandrookie•9 个月前
这是 DeepMind 举办的 Gemma 3n Impact 挑战赛的原型。我们之前没有本地 LLM 的经验,所以这是一个非常有趣的学习体验。希望未来能看到更多轻量级的 LLM 模型!
1 分•作者: scanosss•9 个月前
SBOM Workbench v1.19 发布了。
新功能:
• 直接导入原始结果
• 导入带有源代码的项目
• CycloneDX 输出与 Dependency Track 兼容性更好
获取地址:https://github.com/scanoss/sbom-workbench/releases/tag/v1.19.0
2 分•作者: Bogdanp•9 个月前
2 分•作者: rpgbr•9 个月前
1 分•作者: eivanov89•9 个月前
1 分•作者: rbanffy•9 个月前
1 分•作者: haneefmubarak•9 个月前
1 分•作者: cyb0rg0•9 个月前
1 分•作者: warrenm•9 个月前
6 分•作者: Jetwu•9 个月前
嘿,HN!我想找些人来一起玩玩我为了自学 DSPy 而构建的一个小项目!我一直很喜欢阅读小说和网络小说,并且对两件事一直很好奇:基于读者反馈,LLM 如何迭代地学习写得更好,以及哪些 LLM 实际上最擅长创作(研究基准很酷,但并不一定能转化为实际应用)。
这正是为什么我构建了 narrator.sh!该平台接受用户输入的小说创意,然后使用 DSPy 逐章生成连载小说,根据真实的读者反馈优化写作。我使用 CoT 和并行模块来分解写作任务,使用精炼模块 + LLM 作为评判员来构建奖励函数,并使用 SIMBA 优化器来重新编译前几章的用户评分,以改进后续章节。
我没有使用合成基准,而是跟踪真实的读者指标:阅读时间、评分、书签、评论和回访。这创建了一个排行榜,显示了哪些模型实际上写出了引人入胜的小说,人们想要读完。
目前,对创意写作 LLM 最接近的评估来自作者的角度(OpenRouter 对 Novelcrafter 等工具的使用数据)。但最终,读者决定什么是好的,而不是作者。
你可以在 <a href="https://narrator.sh" rel="nofollow">https://narrator.sh</a> 试用。这是当前的排行榜:<a href="https://narrator.sh/llm-leaderboard" rel="nofollow">https://narrator.sh/llm-leaderboard</a>(目前还比较空,因为用户不多哈哈)
(温馨提示:由于我在 Reddit 上发布了 beta 测试人员,并且人们对提示词的创造力很高,所以有一些成人内容。我正在努力实现内容多样化!)
1 分•作者: niharparikh•9 个月前
1 分•作者: santiix•9 个月前
1 分•作者: tonyabracadabra•9 个月前
1 分•作者: tonyabracadabra•9 个月前
1 分•作者: nemoniac•9 个月前
1 分•作者: speckx•9 个月前
1 分•作者: dabochen•9 个月前
我一直在用 Cursor 处理一些非编码任务,效果非常好。
问题在于,VS Code IDE 是为编码设计的,而我需要一个更好的界面来处理那些非编码任务。
于是,我构建了几个扩展来添加自定义层:
1. CSV 查看器,用于数据分析,将 csv 文件渲染为可编辑的电子表格。
2. 幻灯片制作器,将 .md 文件渲染为幻灯片,并且可以通过 Cursor 代理创建和编辑。
3. I18n 管理器,将多个翻译文件并排加载到一个表格中,同时 Cursor 通过代理更新翻译。
为了让每个人都能使用它,我将核心组件作为工具包开源,可以用来进行 vibe code 你的自定义扩展。它带有一个超级提示模板,通过添加你的需求,你只需一个提示就能获得一个完全可用的扩展。
我这样做部分是作为一项实验,看看在 AI 时代,软件分发是否可以让用户在 vibe coding 的帮助下为最后一公里做出贡献。
1 分•作者: mschuster91•9 个月前