一、传统记忆方案的双重困境 在持续对话场景中,主流技术方案普遍采用”无差别存储+向量检索”的粗放模式。某云厂商的RAG系统在连续交互72小时后,索引库体积膨胀30倍,检索响应时间从80ms激增至2.3秒。这种”记忆肥……