一、技术背景:长文本处理的三大核心挑战 当前主流大模型在处理长文本时普遍面临三大困境:其一,自回归架构导致推理成本随文本长度呈平方级增长;其二,传统注意力机制在超长序列中易出现梯度消失;其三,纯文本……