一、技术融合背景:Diffusion与Transformer的协同效应 生成式视频模型的核心挑战在于同时处理时空维度的高维数据,传统方法(如GAN或纯Transformer架构)往往面临计算效率低或生成质量不稳定的问题。某行业常见技……