融合场景文字的细粒度图像识别:算法与实现