一、多模态大模型的技术演进路径 多模态大模型的发展经历了从“单一模态融合”到“跨模态理解与生成”的跨越式进步。早期技术以图像描述生成(Image Captioning)和语音识别(ASR)为代表,采用“独立编码+简单拼接”的……