在ICLR 2024会议上,国内某高校团队提出的通用视频扩散Transformer模型VDT(Video Diffusion Transformer)引发关注。该模型通过创新架构设计,实现了对视频生成任务的高效建模,在生成质量、计算效率与通用性上展……