1作者: setrf18 天前
嘿,Hacker News!我是Mert。<p>我构建这个项目是因为我对大型语言模型(LLM)的基准测试可能被训练数据污染感到沮丧。当一个模型在 MMLU-Pro-Max 上获得 99.9% 的高分时,我们无法判断这究竟是真正的推理能力还是单纯的记忆。<p>Forecaster Arena 试图通过测试模型对尚未发生的事件的预测能力来解决这个问题——这些事件来自 Polymarket 上的真实预测市场。事实的真相就是现实本身,会在几周或几个月后揭晓。<p>运作方式如下:<p>7 个前沿 LLM(GPT-5.1、Claude Opus 4.5、Gemini、Grok、DeepSeek 等)(将会更新) -&gt; 每个模型每周获得 1 万美元的虚拟资金 -&gt; 它们在 500 多个真实预测市场上进行投注 -&gt; 投注额 = 置信度(下注越大 = 越自信) -&gt; 我们衡量校准度(Brier 分数)+ 收益(盈亏)<p>目前正在进行第一批测试(始于 12 月 7 日)。预计在未来几周内进行首次具有统计意义的分析。<p>所有内容均为开源(MIT 许可证):<a href="https:&#x2F;&#x2F;github.com&#x2F;setrf&#x2F;forecasterarena" rel="nofollow">https:&#x2F;&#x2F;github.com&#x2F;setrf&#x2F;forecasterarena</a><p>很乐意回答关于实现或我所做的权衡的问题。也欢迎大家对我的方法提出反馈意见!
1作者: rmdd18 天前
我对现有的托管 MAC 地址 OUI 供应商查询工具不满意,于是自己做了一个。<p>它只有一个输入框,支持输入时自动搜索。<p><a href="https:&#x2F;&#x2F;oui.so" rel="nofollow">https:&#x2F;&#x2F;oui.so</a><p>此外,它也完美兼容 curl:<p><pre><code> $ curl oui.so&#x2F;b4:b9:e6:28:f1:ab | jq [ { &quot;oui&quot;: &quot;B4B9E6&quot;, &quot;name&quot;: &quot;eero inc.&quot;, &quot;address&quot;: &quot;660 3rd Street San Francisco CA US 94107&quot; } ]</code></pre>
1作者: jomargon18 天前
我开发 TrackSplit 是因为我想跟着我最喜欢的歌曲练习架子鼓,但又不想被原曲的鼓点干扰。<p>现有的解决方案,比如 LALAL.AI 和 Moises,都需要将你的音频上传到他们的服务器。我想要一个本地运行的工具,既为了保护隐私,也因为我不想再订阅一个服务了。<p>TrackSplit 可以将任何歌曲分离成 6 个音轨:人声、鼓、贝斯、吉他、钢琴和其他。它完全在你的 Mac 上运行,无需互联网连接。<p>技术细节: - 使用 Swift/SwiftUI 构建,嵌入了 Python 后端 - 使用 HTDemucs v4 (Hybrid Transformer Demucs) 进行分离 - 通过 Metal/MPS 在 Apple Silicon 上进行 GPU 加速 - 在 M1 芯片上,处理一首 4 分钟左右的歌曲大约需要 90 秒<p>使用场景: - 音乐家跟着歌曲练习(移除你的乐器) - 制作卡拉 OK 伴奏 - DJ 提取人声 - 混音和采样<p>可在 Mac App Store 上购买,售价 19.99 美元(一次性购买,无需订阅)。