一、技术背景与行业痛点 在智能对话系统领域,传统RAG(Retrieval-Augmented Generation)架构面临两大核心挑战:首字延迟过高(通常300-800ms)和对话连贯性不足。当用户输入问题后,系统需要经历”检索-生成-返回……