一、技术架构与核心能力 新一代数字人主播系统基于多模态大模型与智能体协同框架构建,其技术栈可分为四层: 基础模型层:采用4.5T参数规模的多模态大模型,支持语言、语音、视觉三模态的联合训练。通过自回归架……