一、技术背景:从单词元到多词元的范式跃迁 传统自然语言处理(NLP)模型多采用单词元(Single-Token)预测模式,即每次仅预测下一个独立词元。这种模式在短文本生成中表现稳定,但面临两大核心挑战:其一,长序列……