一、多模态架构的核心技术突破 1.1 跨模态注意力机制的进化 DeepSeek采用动态权重分配的跨模态注意力模块,突破传统Transformer的静态连接模式。其核心创新在于引入门控机制,根据输入模态类型(如图像、文本、音……