一、端侧RAG的技术定位与核心挑战 在端侧设备(如手机、IoT终端)部署大语言模型时,面临两大核心矛盾:其一,设备算力与内存资源有限,难以支撑完整大模型的实时推理;其二,传统RAG方案依赖云端检索,导致响应延……