一、大模型的”健忘症”:技术瓶颈与行业痛点 当前主流大模型普遍采用Transformer架构,其自注意力机制虽能捕捉局部上下文,但在处理长序列或跨轮次对话时仍面临显著局限。实验数据显示,当对话轮次超过20轮时,模型……