一、技术演进:从单模态到多模态的范式革命 传统AI系统长期面临”模态孤岛”困境:自然语言处理(NLP)专注于文本,计算机视觉(CV)聚焦图像,语音识别(ASR)处理音频,三者犹如独立的信息处理单元,缺乏跨模态交……