一、技术架构革新:多模态融合的底层突破 Step Fun-1V的核心竞争力源于其”三模态统一编码器+动态注意力路由”架构。该架构通过共享的Transformer编码器同时处理文本、图像、语音三种模态数据,在编码阶段即实现跨模……