一、大模型推理的架构设计范式 1.1 经典推理架构分层 大模型推理系统通常由四层构成:输入预处理层负责数据清洗与格式转换(如文本分词、图像归一化);模型执行层承担核心计算任务,需支持动态批处理(Dynamic Ba……