多模态大模型(MLLM)预训练阶段全解析:从架构到优化 多模态大模型(Multimodal Large Language Model, MLLM)通过融合文本、图像、视频、音频等多模态信息,实现了跨模态理解与生成能力的突破。其预训练阶段(Pre-……