一、技术背景与核心定义 场景文字识别(Scene Text Recognition, STR)是计算机视觉领域的核心任务,旨在从自然场景图像中提取并识别文字信息。传统方案通常采用”检测+识别”分阶段架构:先通过目标检测模型定位文……