一、Transformer架构的宏观设计:编码器-解码器结构 Transformer模型的核心设计采用了编码器-解码器(Encoder-Decoder)的对称架构,这一设计最早源于序列到序列(Seq2Seq)任务,但在Transformer中被赋予了更高效……