一、技术架构:多模态大模型的语音生成革命 基于自研的语音大模型(Speech系列)和音乐大模型(Music系列),该平台构建了完整的语音生成技术栈。其核心架构包含三个层级: 基础模型层:通过2.2亿小时语音数据训……