一、多模态预训练的核心挑战与范式演进 多模态大模型(Multimodal Large Language Models, MLLMs)的预训练面临三大核心挑战:模态异构性(文本、图像、视频、音频的表征差异)、数据稀疏性(部分模态标注数据不足……