1作者: nsomani19 天前
大家好,HN,看来大家对之前 GPT 5.2 Pro 解决的 Erdos 问题反响热烈:<a href="https:&#x2F;&#x2F;news.ycombinator.com&#x2F;item?id=46664631">https:&#x2F;&#x2F;news.ycombinator.com&#x2F;item?id=46664631</a> 我招募了一支由聪明的本科生组成的团队,构建了一个数据集,其中包含了 ChatGPT 对每个未解决的 Erdos 问题的回答,并验证了输出结果。 他们发现: * 3 个问题给出了新的证明(尽管在 2 个案例中,找到了可以扩展以解决相同问题的历史部分结果) * 4 个问题中,5.2 Pro 或 Deep Research 在之前的文献中找到了确切的解决方案,但这些方案此前未被记录 * 3 个问题中,5.2 Pro 或 Deep Research 能够加强文献中之前的结论 * 3 个问题中,发现了问题陈述中的拼写错误 最常见的失败案例是,5.2 Pro 解决了问题,但专业数学家明白问题存在隐含的约束。例如,问题可能说的是整数,但实际上指的是正整数。 很乐意回答关于数据集的任何问题!
1作者: mkotik19 天前
我一直在看到几年前以大约低两倍价格售出的房屋,现在却被挂牌出售,而且没有任何背景信息。买家无法分享观察结果、指出快速翻新,或添加历史背景。像 Zillow 这样的平台避免评论,是有真正的原因,还是主要出于内容审核风险?