一、生成式模型性能评估体系 生成式大语言模型(LLM)的部署需根据业务场景选择核心指标。在批处理任务(如文档摘要生成)中,系统更关注单位时间内处理的请求总量,即吞吐量指标;而在实时交互场景(如对话机器人……