一周热榜

2 分•作者: hasheddan•4 天前

2 分•作者: lfgcampos•4 天前

2 分•作者: julienreszka•4 天前

发泄一下。也许我们其中有人能找到解决办法。我非常生气，因为法国的经济政策不是基于模型所说的最佳行动方案，而是基于选举。民主真是太糟糕了。我也非常恼火，模型在没有任何说明提示有什么问题的情况下就审查内容。我不喜欢内容分发仍然主要由少数几个平台掌控。这其中有些东西非常奇怪。

Show HN：CriteriaBot – 一个通用的可定制分类器

2 分•作者: RoyalTnetennba•6 天前

我需要一个分类器来处理那些不属于典型机器学习应用场景的、细微的、主观的分类（例如，“这是否是剧透？”、“这是否事实正确？”、“这个用户是否在说谎？”）。我最终对我构建的解决这个问题的架构非常满意，于是我将其作为一个独立的 API 和服务推出了，名为 CriteriaBot。 **它的作用：** 你提供内容和简单的英文标准。它会给出内容是否符合这些标准是/否的判断。 **它的工作原理：** 除了传统的分类器外，分类请求还会通过一个由小型、开放权重的大型语言模型（LLM）组成的池进行路由，以达成共识判断。我构建了一个预投票因子分解机，根据主题/类别的嵌入来选择一个优化的 LLM 子集，以获得最佳信号强度。然后，第二个因子分解机读取投票和嵌入，得出单一的判断。该判断会根据用户在语义相似评估中与模型达成一致/不一致的历史记录进行动态调整。这些模型还连接到维基百科和 Wolfram，以支持需要最新信息或数学依据的边缘情况。 **发现：** * 使用相同的测试环境和样本集，Gemma 4 26B 的准确率仅比 Opus 4.8 低约 1 个百分点。 * 纯粹的“神谕”模型理论上非常好——目前在数据集上准确率约为 98%。我将第二个因子分解机用作组合器，因为它理论上可以超越“神谕”结果，但这是一个有趣的备用方案。 * 最有用的大型语言模型出乎我的意料——LFM2 24B 对共识的贡献最大，尽管它单独来看（在我们目前的大型语言模型池中）是最差的。它与其他模型的关联度最低（也许是由于其独特的架构？），这使得它在某些问题上成为一个有用的信号。 * 处理用户提交图像的法律义务……非常复杂。在我解决这个问题之前，我已经为非我本人用户禁用了图像支持（如果你希望尝试“热狗，不是热狗”的话）。 * Rails 将“criteria”的复数形式错误地单数化为“criterium”，直到我花了大量精力去修复才意识到这是错误的。 **发布原因：** 我一直处于倦怠状态，而让这个项目运行起来让我感到非常满足。我生活中大部分非技术人员很难对此给出除了“这是什么？”之外的反应。我非常乐意收到你任何诚实的反馈。

美国科学界一片混乱

2 分•作者: presspot•4 天前

随着 Icarus 黑客声称发动攻击，Klue OAuth 泄露受害者名单不断增加

2 分•作者: parable•1 天前

HN 读者分享：马斯克并没有“拥有”万亿美元，他拥有的是影响力

2 分•作者: ggm•4 天前

我希望有位有能力的经济学家能写博客指出，马斯克（以及其他超级富豪）并没有像图中所暗示的那样，拥有可以堆积在游艇上的流动现金。即使是出售他在特斯拉、X 和 SpaceX 的股份这一行为，也会改变这些资产的价值，改变某个国家税收收入，而印钞本身也需要时间和精力，运送现金也会产生费用。拥有对 1 万亿美元投资的实际影响力是惊人的，但这与“一万亿美元”在性质上并不相同，也并非仅仅是“一百万美元”的量化函数。因为这相当于美国整个经济（约 30 万亿美元）的 1/30，会实质性地改变美国营运资本价值的 3%，以及美国整个股市价值的 1% 多一点。为了获得这些钱，他会制造一场即时的流动性危机。他会吸走所有的股票交易现金，从而立即贬值所有其他股票。这将是一个巨大的事件。

RustChain：面向老旧硬件的去中心化物理基础设施网络

2 分•作者: promptalex53•4 天前

Ask HN：有人用本地模型替换了 Claude/GPT 来进行日常编码吗？

2 分•作者: cloudking•6 天前

这里有人完全用本地模型取代了 Claude/GPT，将其作为主要的编程工具，而不仅仅是用于辅助实验吗？如果有，请分享你的配置和性能（例如，每秒 token 数）。

大多数 CVE-2026-4020 攻击者来自同一个客户端。

2 分•作者: Robbedoes•4 天前

钢结构估算：步骤从来都不是难点

2 分•作者: fazlerocks•4 天前

寻找一位前端开发人员，帮助我构建一个数学网站。

2 分•作者: marysminefnuf•6 天前

零人工智能使用，请

全能基因组学的新前沿：Omnii

2 分•作者: lebovic•6 天前

只需要零星的预同态映射

2 分•作者: wseqyrku•4 天前

展示 HN：产品验证

2 分•作者: cosmok•4 天前

我构建了一个工具，用于帮助判断您正在开发的产品是否存在市场需求。

收益率曲线和波动率曲面在现代金融中构建

2 分•作者: Polly_Liu•6 天前

展示 HN：Prela – 一个组合式且可控的查询语言

2 分•作者: remywang•7 天前

很高兴与大家分享 Prela 查询语言的“第二版”。在分享了上一版本后，我收到了一些宝贵的反馈，其中最主要的是基于 Unicode 的奇怪语法让大家感到困惑。 Prela 现在拥有更熟悉的类 SQL 语法，同时遵循代数原理，这使得该语言具有组合性和可控性，并且核心引擎的代码量仍保持在 1k 行以内。引擎也已从 Julia 重写为 Rust，这带来了更简洁的代码和更快的性能（这不仅仅是因为“Rust 快 Julia 慢”，还涉及一些深入的编译器层面的原因，我希望将来能写文章详细介绍）。长远来看，我认为 Prela 的价值不在于它是一个独立的查询语言，而在于它展示了关系组合子的强大功能，这些组合子可以像迭代器一样，在任何语言中实现。

Claude Code 会扫描您的整个驱动器，并在被发现时承认。

2 分•作者: cashmawy•1 天前

展示 HN：利用 USGS 和 ERA5 数据进行日前河流流量预测

2 分•作者: grezac•4 天前

伊莉莎效应

2 分•作者: WishingWisp•4 天前

上一页 1...36 37 38 39 40...104 下一页