一、有道子曰大模型技术架构解析 作为网易有道自主研发的千亿参数级语言模型,子曰大模型采用Transformer-XL架构与稀疏注意力机制,在保持长文本处理能力的同时,将计算复杂度降低40%。其核心创新点体现在三方面:……