一、技术选型与架构设计 本地语音服务的核心需求包括中文语音识别(ASR)和语音合成(TTS)能力,需兼顾性能、准确率和部署便捷性。当前主流方案分为三类: 开源工具链:Kaldi(ASR)+ Mozilla TTS(TTS)组合,……