一、大模型评估体系的核心框架 大模型评估体系需覆盖模型性能、资源消耗、业务适配性三大维度。性能维度包括准确率、召回率、F1值等基础指标,以及针对生成任务的BLEU、ROUGE等专项指标;资源维度需监控推理延迟、……