MM-Vet多模态大模型评估体系:从测试设计到结果分析的全流程实践 一、多模态大模型评估的挑战与MM-Vet的定位 多模态大模型(如文本-图像、语音-视频联合模型)的评估面临三大核心挑战:模态间对齐质量难以量化(如……