基于ResNet与Transformer的场景文本识别架构设计与实践 一、技术背景与核心价值 场景文本识别(Scene Text Recognition, STR)是计算机视觉领域的核心任务之一,旨在从自然场景图像中识别出包含的文本信息。相较于……