一、Transformer与线性模型的性能差异:现象与本质 在机器学习实践中,开发者常发现一个反直觉现象:某些场景下,简单的线性模型(如逻辑回归、线性SVM)在推理速度、泛化能力或资源占用上显著优于Transformer架构……