一、技术背景与行业痛点 在视频理解领域,传统方案依赖人工标注构建训练数据集,这一过程面临三大核心挑战:其一,标注成本随视频时长呈指数级增长,单个复杂场景标注成本可达数千元;其二,人工标注存在主观偏差……