智能交互系统的可扩展多模态注释:EMMA语言解析 引言:多模态交互的崛起与挑战 在智能交互系统快速发展的今天,单一模态(如纯语音或纯文本)已难以满足复杂场景的需求。用户期望通过语音、手势、眼神、触控等多模……