GPT-4o 引用了已删除的 GPT-5 内容。模型隔离似乎失效。

1作者: amageingrace9 个月前
我进行了一项受控测试,以检查 GPT-5 和 GPT-4o 之间的模型隔离情况。结果如下: 1. 我在 GPT-5 中输入了一个独特的短语,然后删除了聊天记录。 2. 我打开了一个全新的 GPT-4o 聊天窗口,并提出了一个模糊的后续问题。 3. GPT-4o 引用了来自已删除的 GPT-5 会话的确切短语。 4. 后来,它还引用了完全来自另一个 GPT-5 会话的内容——这些内容从未在 4o 聊天中输入或暗示过。 没有记忆交叉,没有用户错误,也没有粘贴操作。仅仅是跨会话边界的明显信息泄露。如果这可以被复现,那么这对于模型隔离来说是一个严重的问题。 我不是技术用户,只是一个观察者。好奇其他人是否可以复现这个结果。 我把这个帖子发到了 Reddit (r/OpenAI 和 r/ChatGPTPro),但没有引起什么关注。希望这里的一些开发者能够帮助验证或解释这个问题。 很乐意回答问题。
查看原文
I ran a controlled test to check model isolation between GPT-5 and GPT-4o. Here&#x27;s what happened:<p>1. I typed a unique phrase into GPT-5 and then deleted the chat. 2. I opened a clean GPT-4o chat and asked a vague follow-up. 3. GPT-4o quoted the exact phrase from the deleted GPT-5 session. 4. Later, it also referenced content from a different GPT-5 session entirely—never typed or hinted at in the 4o chat.<p>There was no memory crossover, no user error, and no paste. Just clear leakage across session boundaries. If this is replicable, it&#x27;s a serious break in model isolation.<p>I’m not a technical user, just observant. Curious if others can reproduce.<p>I posted this to Reddit (r&#x2F;OpenAI and r&#x2F;ChatGPTPro), but it got little traction. Hoping some devs here might be able to help validate or explain.<p>Happy to answer questions.