实时语音识别作为人机交互的核心场景,对延迟和准确率的双重需求日益严苛。传统语音识别模型受限于算力与架构,难以兼顾高精度与低延迟;而大模型虽具备更强的语义理解能力,却因参数量庞大、计算复杂度高,常被视……