一、SpeechT5:语音交互领域的”瑞士军刀” 作为微软亚洲研究院推出的预训练语音模型,SpeechT5凭借其统一的多模态架构,在语音合成(TTS)、语音识别(ASR)和语音转换(VC)三大核心任务中实现了性能突破。该模型……