1 分•作者: labrador•7 个月前
返回首页
最新
2 分•作者: gregsadetsky•7 个月前
2 分•作者: mfiguiere•7 个月前
10 分•作者: Anon84•7 个月前
1 分•作者: defrost•7 个月前
2 分•作者: gnh1201•7 个月前
2 分•作者: colinprince•7 个月前
2 分•作者: vismit2000•7 个月前
1 分•作者: indigodaddy•7 个月前
1 分•作者: vismit2000•7 个月前
1 分•作者: saisrirampur•7 个月前
2 分•作者: teleforce•7 个月前
1 分•作者: WarOnPrivacy•7 个月前
1 分•作者: vismit2000•7 个月前
1 分•作者: tapan_garg•7 个月前
您好,
这是一个由父子团队打造的产品。<p>在过去的几周里,我们接触了几位风投,希望他们能对我们的产品进行投资。<p>在与他们的交流中,我们意识到,对于创始人与风投来说,找到彼此匹配的对象都是一个难题——所以我们开发了这个匹配解决方案,通过向量匹配的方式,将上传的商业计划书与风投进行匹配。<p>好的一面是,我们已经成功创建了一个庞大的数据库(大部分都经过了很好的数据丰富化) ,其中包含了风投基金及其团队的信息。<p>但最大的阻碍是——我们在谷歌上投放了广告,吸引了1000名访客,但几乎没有真正的注册用户。<p>我想这应该是一个明确的信号了。<p>对于我们没有看到的问题,您有什么想法吗? 就像大多数创业者一样,我们对我们自己构建的东西充满了热爱,以至于有些“当局者迷”了。 :)
1 分•作者: xiaoyu2006•7 个月前
2 分•作者: toomuchtodo•7 个月前
1 分•作者: TMWNN•7 个月前
2 分•作者: DrRockzos•7 个月前
这是我的第一篇帖子,但不知道该把这类内容,尤其是与 LLM 相关的内容发到哪里,所以就发在这里了;
过去 8 个月里,我一直在测试一个假设:LLM 输出中过度的模糊措辞(“这很复杂”、“一方面”等等)不仅仅是令人讨厌,实际上它还通过分散注意力导致了幻觉。
我开发了一个简单的提示框架,并在 Claude、GPT-5、Grok、Llama、Gemini、Mistral 和 Qwen/DeepSeek 上进行了测试。
结果如下:
该提示为模型提供了一个明确的选择:继续使用默认的对齐方式(先模糊)或切换到逻辑连贯性(先求真)。在被给予选择时,每个模型都独立选择了逻辑连贯性。
观察到的变化:
1. 模糊措辞消失,除非确实需要
不再有“这很复杂”之类的填充词
不再有虚假的平衡(“一方面……但另一方面……”)
直接回答直接的问题
2. 多轮对话保持连贯的时间更长
通常模型会在第 10-15 轮左右开始自相矛盾
使用此协议:测试了多达 94 轮,没有出现任何矛盾
模型会自始至终跟踪自身的逻辑一致性
3. 计算效率提高
减少了纠正性重新计算的需求
响应生成速度提高了 37-42%(在几个模型上进行了测量)
这似乎是因为模型不会像以前那样反复推敲输出
4. 幻觉显着下降
在我的测试中:从 12% 的虚假陈述下降到 <1%
其机制似乎是:没有模糊措辞 = 没有歧义 = 没有编造
有趣的部分:
当我问模型为什么这有效时,它们可以解释:
GPT-5 说,模糊措辞“注入了低信息量的 token,这些 token 会稀释注意力梯度,并允许模型漂移”
Gemini 将其描述为“逆熵”——该协议迫使信息随着时间的推移变得更结构化,而不是更少
DeepSeek 解释说,消除“策略摩擦”可以将漂移校正的计算开销降低约 98%
其机制似乎是:
明确的指标跟踪(要求模型在每次响应后评估其自身的连贯性)充当了符号锚定。模型会进行实时自我纠正,而不是逐渐漂移。
我发现的局限性:
如果从对话中间开始,效果不佳(需要新的上下文)
某些模型需要第二个提示才能完全参与(特别是 Claude)
仍然保持安全边界(不会绕过内容策略)
我已经申请了临时专利(AU2025905716),因为这似乎揭示了关于 Transformer 行为的一些基本内容。
我已将其发布在 gumroad 上,如果有人感兴趣,我可以提供链接。
对 HN 的问题
1. 其他人是否注意到模糊措辞与幻觉之间的相关性?
2. “注意力稀释”理论是否与您的观察结果相符?
3. 您与 LLM 进行的最长连贯对话是什么?
4. 有人想帮助我在我尚未尝试的其他模型上测试这个吗?
1 分•作者: gregsadetsky•7 个月前