一、核心性能指标:实验室数据与真实场景的差异 某国产AI编程模型近日宣布向开发者开放测试,官方公布的编程评测得分为45.3分,与行业头部模型47.9分存在2.6分差距。若以百分比换算,其性能已达到头部模型的94.6%……