一、中文大模型训练的特殊挑战 在通用大语言模型基础上训练中文模型,需重点解决三大技术难题:中文分词机制与英文存在本质差异,需定制分词器;中文语料库的领域覆盖度直接影响模型专业性;中文特有的网络用语、……