2 分•作者: cryptography•8 个月前
我一直在使用 Cursor,我对一件事真的很好奇。<p>当你粘贴一张 UI 损坏的截图,它能立刻发现未对齐的 div 或者 padding 问题——它实际上是在进行视觉分析,还是仅仅根据训练数据对常见的 UI 错误进行模式匹配?<p>这个速度快得几乎不像真正的视觉处理。而且,它似乎理解空间关系和布局的方式,与仅仅描述图像感觉不同。<p>这些工具使用的是标准的视觉模型,还是有预处理?图像本身提供了多少信息,与周围的代码上下文相比呢?<p>有人知道它内部实际运作的技术细节吗?