一、Transformer的瓶颈与Mamba的诞生背景 自2017年Transformer架构提出以来,其凭借自注意力机制(Self-Attention)和并行计算能力,迅速成为自然语言处理(NLP)、计算机视觉(CV)等领域的核心架构。然而,随着……