一、技术背景与演进路径 1.1 DeepSeek的起源与发展 DeepSeek作为一款基于Transformer架构的预训练语言模型,其技术演进可分为三个阶段: 基础架构阶段:采用12层Transformer编码器,参数量1.2亿,支持中英文双语……