引言:多模态大模型训练的数据瓶颈 随着多模态大模型(如视觉-语言模型、视频理解模型)的快速发展,跨模态数据的质量与规模成为制约模型性能的核心因素。传统数据集常面临三大问题: 模态单一性:多数数据集仅……