基于Tesseract OCR的文本识别:从原理到代码实践