一、语音转文字技术核心原理 语音转文字(ASR)的本质是将声学信号转换为文本序列,其技术栈包含三个核心模块: 声学特征提取:通过短时傅里叶变换(STFT)将时域信号转为频域特征,配合梅尔频率倒谱系数(MFCC)……