一、技术背景与核心意义 场景识别是计算机视觉领域的核心课题之一,其本质是通过分析视觉输入(如图像、视频帧),识别画面中物体的类别、位置及其空间/语义关系。传统方法依赖手工设计的特征提取器(如SIFT、HOG……