Transformer回归任务:从架构设计到工程实践 在深度学习领域,Transformer架构凭借自注意力机制和并行计算能力,已成为自然语言处理(NLP)的核心模型。然而,其应用场景正逐步扩展至回归任务(如时间序列预测、连……