2作者: GhostDrift9 个月前
我们构建了两个实时演示,以阐释幽灵漂移理论——一个用于建模语义连贯性的框架——以及一种名为 GD-Attention 的新型注意力机制。 • 第一部分 — 语义能量景观:实时可视化独特的连贯点 s* 和跳跃方向 g。 • 第二部分 — GD-Attention vs Softmax:“Softmax 融合,GD-Attention 选择”——交互式探索差异。 论文(附 Zenodo DOI):[幽灵漂移理论 & GD-Attention PDF](<a href="https:&#x2F;&#x2F;zenodo.org&#x2F;records&#x2F;16757311" rel="nofollow">https:&#x2F;&#x2F;zenodo.org&#x2F;records&#x2F;16757311</a>) ▶ 第一部分:<a href="https:&#x2F;&#x2F;gdt-semantic-energy-demo-jdgoe6gkrohleltjgvwgwq.streamlit.app" rel="nofollow">https:&#x2F;&#x2F;gdt-semantic-energy-demo-jdgoe6gkrohleltjgvwgwq.stre...</a> ▶ 第二部分:<a href="https:&#x2F;&#x2F;gda-vs-softmax-demo-zooif4cfewrmnv85zaqymy.streamlit.app" rel="nofollow">https:&#x2F;&#x2F;gda-vs-softmax-demo-zooif4cfewrmnv85zaqymy.streamlit...</a> 欢迎对清晰度、用例和潜在改进提出反馈意见。
2作者: el_hacker9 个月前
它与其他开源大语言模型,如 DeepSeek、Qwen 和 Gemma 相比如何?尤其是在推理和编码能力方面? 如果你测试过它,有什么让你感到惊喜(好或坏)吗?是否值得从现有的开源模型切换? 我们更关注实际使用体验,而不是单纯的基准测试结果。
1作者: hhh9 个月前
我看到越来越多的人在个人生活中陷入困境,过得并不好,转而向 ChatGPT 寻求慰藉、见解或调查,感觉他们中的许多人正在慢慢陷入某种精神错乱,而且我在社交媒体上不断看到这种情况,看到新人完全脱离现实,相信电脑告诉他们的东西。 感觉我们已经实现了看似不可能的事情,但在短短三年内,它已经演变成 75% 的“帮我做作业”,15% 的个人问题(其中一部分人进入了这个妄想群体),以及 10% 的“沉迷色情”…… 我很惊讶我们还没有开始看到主要实验室在努力解决这个问题上做出更多努力……在 GPT-5 的发布会上提到了谄媚,但除此之外真的没有太多了。 感觉这将是一个日益严重的问题,但我甚至不知道该从何入手,才能让我的朋友和家人对机器输出的内容三思而后行。