Win10下Python3.8部署FastAPI与PaddlePaddle实现证件识别

一、环境准备与依赖安装

在Windows 10系统中搭建开发环境，需确保Python 3.8及兼容的包管理工具已就位。推荐使用虚拟环境隔离项目依赖，避免全局污染。

1. 创建Python虚拟环境

python -m venv ocr_env
.\ocr_env\Scripts\activate  # 激活虚拟环境

2. 安装FastAPI与ASGI服务器

FastAPI依赖ASGI服务器（如Uvicorn）处理HTTP请求，通过pip安装核心框架及服务器：

pip install fastapi uvicorn[standard]

3. 部署PaddlePaddle深度学习框架

根据硬件配置选择安装版本。若使用CPU，直接安装基础版；若配备NVIDIA GPU，需安装CUDA/cuDNN兼容版本：

# CPU版本
pip install paddlepaddle
# GPU版本（需提前配置CUDA 10.2/11.2等）
pip install paddlepaddle-gpu==2.4.0.post117 -f https://www.paddlepaddle.org.cn/whl/windows/mkl/avx/stable.html

验证安装：

import paddle
paddle.utils.run_check()  # 输出"PaddlePaddle is installed successfully!"即表示成功

二、证件识别模型集成

基于PaddleOCR提供的预训练模型，可快速实现高精度文本识别。此处以通用中文OCR模型为例，支持身份证、营业执照等结构化文本提取。

1. 下载PaddleOCR模型

从官方仓库获取PP-OCRv3系列模型（轻量级、高精度可选）：

git clone https://github.com/PaddlePaddle/PaddleOCR.git
cd PaddleOCR
pip install -r requirements.txt

或直接下载预编译模型文件（推荐）：

检测模型：ch_PP-OCRv3_det_infer
识别模型：ch_PP-OCRv3_rec_infer
分类模型：ch_ppocr_mobile_v2.0_cls_infer

2. 模型加载与初始化

在Python中实例化OCR工具，配置模型路径及识别参数：

from paddleocr import PaddleOCR
ocr = PaddleOCR(
    use_angle_cls=True,  # 启用角度分类
    lang="ch",           # 中文识别
    det_model_dir="./ch_PP-OCRv3_det_infer",  # 检测模型路径
    rec_model_dir="./ch_PP-OCRv3_rec_infer",  # 识别模型路径
    cls_model_dir="./ch_ppocr_mobile_v2.0_cls_infer"  # 分类模型路径
)

三、FastAPI服务构建

FastAPI通过装饰器定义路由，结合PaddleOCR实现证件识别API。

1. 基础API设计

创建main.py文件，定义文件上传与识别接口：

from fastapi import FastAPI, UploadFile, File
from paddleocr import PaddleOCR
import cv2
import numpy as np
app = FastAPI()
ocr = PaddleOCR(use_angle_cls=True, lang="ch")
@app.post("/recognize/idcard")
async def recognize_idcard(file: UploadFile = File(...)):
    # 读取上传的图片
    contents = await file.read()
    nparr = np.frombuffer(contents, np.uint8)
    img = cv2.imdecode(nparr, cv2.IMREAD_COLOR)
    # 执行OCR识别
    result = ocr.ocr(img, cls=True)
    # 提取关键字段（示例：身份证号、姓名）
    extracted_data = []
    for line in result:
        if line[1][0].startswith(("姓名", "身份证号")):  # 需根据实际模型输出调整
            extracted_data.append({
                "text": line[1][0],
                "confidence": line[1][1]
            })
    return {"status": "success", "data": extracted_data}

2. 多证件类型支持

通过路由参数区分证件类型，动态加载识别逻辑：

@app.post("/recognize/{doc_type}")
async def recognize_doc(doc_type: str, file: UploadFile = File(...)):
    if doc_type not in ["idcard", "business_license"]:
        return {"status": "error", "message": "Unsupported document type"}
    # 根据doc_type加载不同预处理逻辑（如营业执照需裁剪特定区域）
    # ...（此处省略具体实现）
    return {"status": "success", "doc_type": doc_type}

四、性能优化与部署建议

1. 模型量化与加速

动态图转静态图：使用paddle.jit.save将模型转换为静态图，提升推理速度。

TensorRT加速（GPU环境）：

config = paddle.inference.Config("./ch_PP-OCRv3_det_infer/inference.pdmodel", 
                                "./ch_PP-OCRv3_det_infer/inference.pdiparams")
config.enable_use_gpu(100, 0)  # 使用GPU 0
config.enable_tensorrt_engine(precision_mode=paddle.inference.Config.Precision.Int8)

2. 异步处理与并发

使用BackgroundTasks处理耗时操作（如日志记录）。

配置Uvicorn工作线程数：

uvicorn main:app --workers 4 --host 0.0.0.0 --port 8000

3. 安全性增强

限制文件类型（仅允许.jpg, .png）：

ALLOWED_EXTENSIONS = {"jpg", "jpeg", "png"}
def allowed_file(filename):
    return '.' in filename and filename.rsplit('.', 1)[1].lower() in ALLOWED_EXTENSIONS

启用HTTPS与API密钥验证（通过中间件实现）。

五、完整部署流程

环境搭建：安装Python 3.8、虚拟环境、FastAPI、PaddlePaddle。
模型准备：下载PaddleOCR预训练模型并解压至指定目录。
代码实现：编写main.py，定义API路由与OCR逻辑。

测试验证：使用Postman或curl测试接口：

curl -X POST -F "file=@test_idcard.jpg" http://localhost:8000/recognize/idcard

生产部署：通过Nginx反向代理或Docker容器化部署。

六、常见问题与解决方案

CUDA版本不兼容：确保PaddlePaddle-GPU版本与本地CUDA驱动匹配，参考官方版本对照表。
内存不足：调整批量处理大小（batch_size）或启用模型量化。
中文识别乱码：检查lang参数是否设置为"ch"，并确认模型文件完整。

通过上述步骤，开发者可在Windows 10环境下快速构建基于FastAPI与PaddlePaddle的高效证件识别服务，适用于身份证、营业执照等多场景文本提取需求。