一、技术选型与架构设计 本方案采用模块化架构设计,包含三个核心组件: 语音识别层:Whisper模型实现语音转文本,支持53种语言及方言识别,在CPU环境下可达到实时处理能力。 语义理解层:DeepSeek-R1-7B模型进行……