一、技术背景与核心需求 语音合成(Text-to-Speech, TTS)技术已从早期规则驱动的合成系统,发展为基于深度学习的端到端生成模型。主流云服务商提供的在线TTS服务虽能实现高质量语音输出,但其依赖网络连接、隐私……