1作者: tapan_garg7 个月前
您好, 这是一个由父子团队打造的产品。<p>在过去的几周里,我们接触了几位风投,希望他们能对我们的产品进行投资。<p>在与他们的交流中,我们意识到,对于创始人与风投来说,找到彼此匹配的对象都是一个难题——所以我们开发了这个匹配解决方案,通过向量匹配的方式,将上传的商业计划书与风投进行匹配。<p>好的一面是,我们已经成功创建了一个庞大的数据库(大部分都经过了很好的数据丰富化) ,其中包含了风投基金及其团队的信息。<p>但最大的阻碍是——我们在谷歌上投放了广告,吸引了1000名访客,但几乎没有真正的注册用户。<p>我想这应该是一个明确的信号了。<p>对于我们没有看到的问题,您有什么想法吗? 就像大多数创业者一样,我们对我们自己构建的东西充满了热爱,以至于有些“当局者迷”了。 :)
2作者: DrRockzos7 个月前
这是我的第一篇帖子,但不知道该把这类内容,尤其是与 LLM 相关的内容发到哪里,所以就发在这里了; 过去 8 个月里,我一直在测试一个假设:LLM 输出中过度的模糊措辞(“这很复杂”、“一方面”等等)不仅仅是令人讨厌,实际上它还通过分散注意力导致了幻觉。 我开发了一个简单的提示框架,并在 Claude、GPT-5、Grok、Llama、Gemini、Mistral 和 Qwen/DeepSeek 上进行了测试。 结果如下: 该提示为模型提供了一个明确的选择:继续使用默认的对齐方式(先模糊)或切换到逻辑连贯性(先求真)。在被给予选择时,每个模型都独立选择了逻辑连贯性。 观察到的变化: 1. 模糊措辞消失,除非确实需要 不再有“这很复杂”之类的填充词 不再有虚假的平衡(“一方面……但另一方面……”) 直接回答直接的问题 2. 多轮对话保持连贯的时间更长 通常模型会在第 10-15 轮左右开始自相矛盾 使用此协议:测试了多达 94 轮,没有出现任何矛盾 模型会自始至终跟踪自身的逻辑一致性 3. 计算效率提高 减少了纠正性重新计算的需求 响应生成速度提高了 37-42%(在几个模型上进行了测量) 这似乎是因为模型不会像以前那样反复推敲输出 4. 幻觉显着下降 在我的测试中:从 12% 的虚假陈述下降到 <1% 其机制似乎是:没有模糊措辞 = 没有歧义 = 没有编造 有趣的部分: 当我问模型为什么这有效时,它们可以解释: GPT-5 说,模糊措辞“注入了低信息量的 token,这些 token 会稀释注意力梯度,并允许模型漂移” Gemini 将其描述为“逆熵”——该协议迫使信息随着时间的推移变得更结构化,而不是更少 DeepSeek 解释说,消除“策略摩擦”可以将漂移校正的计算开销降低约 98% 其机制似乎是: 明确的指标跟踪(要求模型在每次响应后评估其自身的连贯性)充当了符号锚定。模型会进行实时自我纠正,而不是逐渐漂移。 我发现的局限性: 如果从对话中间开始,效果不佳(需要新的上下文) 某些模型需要第二个提示才能完全参与(特别是 Claude) 仍然保持安全边界(不会绕过内容策略) 我已经申请了临时专利(AU2025905716),因为这似乎揭示了关于 Transformer 行为的一些基本内容。 我已将其发布在 gumroad 上,如果有人感兴趣,我可以提供链接。 对 HN 的问题 1. 其他人是否注意到模糊措辞与幻觉之间的相关性? 2. “注意力稀释”理论是否与您的观察结果相符? 3. 您与 LLM 进行的最长连贯对话是什么? 4. 有人想帮助我在我尚未尝试的其他模型上测试这个吗?