一、模型架构与核心技术创新 SD3 Medium作为第三代文本到图像生成模型的中间版本,采用多模态扩散转换器(MMDiT)架构,通过分离文本与图像的注意力处理机制,显著提升复杂语义理解能力。其核心架构包含三大创新模……