一、多模态大模型的技术演进路径 多模态学习并非新兴概念,其发展可追溯至2014年深度学习兴起初期。早期研究聚焦于图像描述生成(Image Captioning)和视觉问答(VQA)等任务,采用双塔结构分别处理视觉与文本特征……