一、RPM与TPM的核心定义:从概念到技术本质 RPM(Requests Per Minute),即每分钟请求数,是衡量AI模型服务系统并发处理能力的关键指标。它直接反映了服务端在单位时间内能够响应的独立请求次数,例如用户通过API……