一、评估体系构建:从单一指标到多模态覆盖 大语言模型的内容生成能力已从文本扩展至图像、音频等多模态领域,评估体系需同步构建跨模态的统一框架。当前主流评估方法可分为客观指标与主观评价两大类:前者通过数……