一、Token的本质与分类 Token是AI模型处理自然语言的基本单元,其本质是将连续文本拆解为离散语义片段的标准化方法。根据拆解粒度可分为字符级、子词级和单词级三种类型: 字符级Token:以单个字符为最小单位(如……