一、多模态情感识别的技术演进与Interspeech 2019的突破点 传统语音情感识别(SER)主要依赖声学特征(如音高、能量、MFCC)或语言学特征(如词性、语义),但单模态方法在复杂场景下存在局限性。例如,愤怒情绪可……