一、压测动机:当常规测试失去意义 在某金融风控系统的开发过程中,团队发现DeepSeek-R1模型在常规QA测试中表现优异,但在处理实时交易反欺诈场景时出现0.3%的误判率波动。这个看似微小的数字,在日均千万级交易……