一、AIME竞赛背景与模型刷榜现象 AIME(American Invitational Mathematics Examination)作为美国数学邀请赛,长期被视为衡量模型数学推理能力的权威基准。近期,某开源大模型Qwen的半成品版本在AIME 2025测试中……