探索深度学习架构新路径:Transformer之外的多元选择 自2017年Transformer架构提出以来,其凭借自注意力机制与并行计算能力,迅速成为自然语言处理(NLP)领域的基石,并逐步扩展至计算机视觉、语音识别等多模态任……