一、SpeechT5:全场景语音技术的统一框架 SpeechT5是由科研团队提出的基于预训练模型的语音处理框架,其核心创新在于通过统一的编码器-解码器架构同时支持语音合成(TTS)、语音识别(ASR)及语音翻译(ST)等任务……