一、大模型推理效能评估体系的构建逻辑 大模型推理效能的核心指标包含吞吐量(QPS)、延迟(Latency)、功耗(Power Consumption)及成本效率(Cost-per-Query)四大维度。以某主流云服务商的测试环境为例,在相同……