一、迁移学习与Transformer的结合背景 Transformer架构凭借自注意力机制和并行计算能力,在自然语言处理(NLP)、计算机视觉(CV)等领域取得了突破性成果。然而,其预训练-微调范式面临两大挑战: 数据依赖性……