一、架构设计范式的本质差异 Transformer架构与主流CV架构(如ResNet、YOLO等)的核心差异源于对数据本质的假设不同。CV架构基于局部空间相关性假设,认为图像中相邻像素具有强关联性,因此采用卷积核进行局部特征……