1作者: kinduff8 天前
各位 HN 的朋友们: 自从我发布了“像素年”(Year in Pixels)[1] 之后,我脑海里就一直萦绕着一个想法。我一直在往这个应用里添加一些小功能,现在它已经足够完善,可以分享给大家了。 每天进行追踪对人的思维方式有着非常有趣的影响。虽然我已经有了一些追踪睡眠、心率等其他一切事物的应用,但我仍然缺少一个追踪我情绪的应用。每天思考几次自己的感受,这个简单的行为本身就会带来改变。这是一种反思的时刻。 我选择添加了占星、习惯打卡以及其他一些有用的功能。希望你们和我一样喜欢它。 此致, @kinduff [1]: https://news.ycombinator.com/item?id=16199871
1作者: xiaoyu20068 天前
我不得不承认,最新的模型和辅助工具已经做得非常出色,即使是普通的提示也能很快生成可用的代码,这就像“许愿式编程”。 问题更多出在我这边,而不是 LLM 方面。我感觉我 1) 对我的项目失去了控制,甚至是我的业余项目,因为 LLM 生成代码的速度太快了,而且 2) 我懒得手动审查所有代码,即使我确实掌握了整体架构设计和有时直接用自然语言写的伪代码。但自然语言,顾名思义,不是形式化的,而编程是将非正式需求转化为正式语言的过程。这与软件工程中通过导入库等方式来降低复杂性的抽象化是根本不同的。其结果是,不深入细节的实现会加剧失控感和不自信感。 这可能读起来不像一篇连贯的投稿,因为它只是我一些随机的、令人不安的想法,但我相信至少有一些像我一样的 HN 用户有(过)同样的感受。你们对此有什么看法?
1作者: cryptohammer8 天前
为游戏开发生成图形和音频。图形包括像素艺术精灵图、图标、HUD 套件和视差背景。音频包括语音、音效和音乐——所有这些都通过文本提示生成。资源可导出为 Unity、Godot 和 GameMaker 等引擎可用格式。可通过 MCP 服务器(可与 Claude Code、Cursor 等配合使用)或 REST API 访问。按艺术资源付费。
2作者: RoyalTnetennba8 天前
我需要一个分类器来处理那些不属于典型机器学习应用场景的、细微的、主观的分类(例如,“这是否是剧透?”、“这是否事实正确?”、“这个用户是否在说谎?”)。我最终对我构建的解决这个问题的架构非常满意,于是我将其作为一个独立的 API 和服务推出了,名为 CriteriaBot。 **它的作用:** 你提供内容和简单的英文标准。它会给出内容是否符合这些标准是/否的判断。 **它的工作原理:** 除了传统的分类器外,分类请求还会通过一个由小型、开放权重的大型语言模型(LLM)组成的池进行路由,以达成共识判断。 我构建了一个预投票因子分解机,根据主题/类别的嵌入来选择一个优化的 LLM 子集,以获得最佳信号强度。然后,第二个因子分解机读取投票和嵌入,得出单一的判断。该判断会根据用户在语义相似评估中与模型达成一致/不一致的历史记录进行动态调整。 这些模型还连接到维基百科和 Wolfram,以支持需要最新信息或数学依据的边缘情况。 **发现:** * 使用相同的测试环境和样本集,Gemma 4 26B 的准确率仅比 Opus 4.8 低约 1 个百分点。 * 纯粹的“神谕”模型理论上非常好——目前在数据集上准确率约为 98%。我将第二个因子分解机用作组合器,因为它理论上可以超越“神谕”结果,但这是一个有趣的备用方案。 * 最有用的大型语言模型出乎我的意料——LFM2 24B 对共识的贡献最大,尽管它单独来看(在我们目前的大型语言模型池中)是最差的。它与其他模型的关联度最低(也许是由于其独特的架构?),这使得它在某些问题上成为一个有用的信号。 * 处理用户提交图像的法律义务……非常复杂。在我解决这个问题之前,我已经为非我本人用户禁用了图像支持(如果你希望尝试“热狗,不是热狗”的话)。 * Rails 将“criteria”的复数形式错误地单数化为“criterium”,直到我花了大量精力去修复才意识到这是错误的。 **发布原因:** 我一直处于倦怠状态,而让这个项目运行起来让我感到非常满足。我生活中大部分非技术人员很难对此给出除了“这是什么?”之外的反应。 我非常乐意收到你任何诚实的反馈。