一、技术突破:0.36B参数背后的架构革新 ERNIE 4.5的核心创新在于其动态稀疏注意力机制。传统Transformer模型采用固定全连接结构,导致参数量与计算量随层数线性增长。ERNIE 4.5通过引入门控稀疏连接,使每个token……