引言:全模态交互的必然性 在人工智能技术发展的进程中,多模态交互始终是核心目标之一。传统模型受限于单模态架构,难以实现跨模态信息的深度融合,导致在复杂场景下(如实时音视频对话)的交互体验存在割裂感。……