引言 声音情绪识别(Speech Emotion Recognition, SER)作为人机交互领域的重要分支,旨在通过分析语音信号中的情感特征,实现情绪状态的自动分类(如快乐、悲伤、愤怒等)。传统方法多依赖手工特征提取(如MFCC、……