PaddleOCR在Windows下的C++部署全攻略

一、部署背景与需求分析

OCR（光学字符识别）技术在文档数字化、票据处理、工业质检等场景中应用广泛。对于Windows平台的C++开发者而言，将高性能的OCR模型集成到本地应用中，既能保证离线运行能力，又能避免依赖第三方云服务的潜在风险。PaddleOCR作为一款开源的OCR工具库，支持中英文、多语言识别及多种文字检测算法，其C++接口的灵活性使其成为Windows桌面应用开发的理想选择。

二、环境准备与依赖安装

1. 系统要求

操作系统：Windows 10/11（64位）
开发工具：Visual Studio 2019/2022（需安装C++桌面开发组件）
硬件配置：建议CPU为Intel i5及以上，内存≥8GB，若需GPU加速需支持CUDA的NVIDIA显卡。

2. 依赖库安装

OpenCV：用于图像预处理。通过vcpkg安装：
```
vcpkg install opencv:x64-windows
```
Paddle Inference：PaddleOCR的推理引擎。从官方GitHub下载预编译的Windows版库，或通过源码编译。
CMake：用于项目构建，建议版本≥3.15。

三、项目构建与代码集成

1. 创建CMake项目

在Visual Studio中新建CMake项目，配置CMakeLists.txt文件，示例如下：

cmake_minimum_required(VERSION 3.15)
project(PaddleOCR_Demo)
# 添加OpenCV路径（根据实际安装路径修改）
set(OpenCV_DIR "C:/vcpkg/installed/x64-windows/share/opencv")
find_package(OpenCV REQUIRED)
# 添加Paddle Inference路径
include_directories("path/to/paddle_inference/include")
link_directories("path/to/paddle_inference/lib")
# 添加源文件
add_executable(PaddleOCR_Demo main.cpp)
# 链接库
target_link_libraries(PaddleOCR_Demo
    ${OpenCV_LIBS}
    paddle_inference
)

2. 模型与配置文件准备

模型下载：从PaddleOCR官方仓库下载预训练模型（如ch_PP-OCRv3_det_infer、ch_PP-OCRv3_rec_infer）。

配置文件：修改infer_cfg.yml，指定模型路径、是否使用GPU等参数：

Global:
  use_gpu: false
  use_tensorrt: false
Det:
  model_dir: ./models/ch_PP-OCRv3_det_infer
Rec:
  model_dir: ./models/ch_PP-OCRv3_rec_infer
  char_list_file: ./ppocr/utils/ppocr_keys_v1.txt

3. 核心代码实现

在main.cpp中实现OCR推理流程，关键步骤如下：

#include <opencv2/opencv.hpp>
#include "paddle_inference_api.h"
#include "ocr_utils.h" // 自定义工具函数
int main() {
    // 1. 初始化Paddle预测器
    paddle_infer::Config config;
    config.SetModel("models/ch_PP-OCRv3_det_infer/model.pdmodel",
                    "models/ch_PP-OCRv3_det_infer/model.pdiparams");
    config.EnableUseGpu(100, 0); // 使用GPU（若可用）
    auto predictor = paddle_infer::CreatePredictor(config);
    // 2. 加载图像并预处理
    cv::Mat img = cv::imread("test.jpg");
    auto input_tensor = predictor->GetInputHandle("x");
    std::vector<int> input_shape = {1, 3, img.rows, img.cols};
    input_tensor->Reshape(input_shape);
    // 将图像数据转换为float并归一化（代码略）
    // 3. 运行检测模型
    predictor->Run();
    // 4. 获取检测结果并解析
    auto output_tensor = predictor->GetOutputHandle("save_infer_model/scale_0.tmp_0");
    std::vector<float> output_data;
    output_tensor->CopyToCpu(output_data);
    // 解析检测框（代码略）
    // 5. 裁剪ROI区域并运行识别模型（类似步骤1-4）
    // ...
    return 0;
}

四、性能优化与调试技巧

1. 推理加速

GPU加速：在Config中启用EnableUseGpu，并指定CUDA流。
TensorRT优化：若使用NVIDIA GPU，可编译支持TensorRT的Paddle Inference库，在配置中开启use_tensorrt。
批处理：对多张图像进行批量推理，减少IO开销。

2. 内存管理

复用InputHandle和OutputHandle，避免频繁创建销毁。
使用std::vector管理动态内存，避免手动new/delete。

3. 常见问题排查

模型加载失败：检查路径是否包含中文或空格，确认模型文件完整性。
CUDA错误：验证驱动版本与CUDA Toolkit版本匹配，使用nvidia-smi查看GPU状态。
结果异常：检查输入图像是否归一化到[0,1]范围，颜色通道顺序是否为BGR。

五、扩展功能与最佳实践

1. 多语言支持

通过替换识别模型（如en_PP-OCRv3_rec_infer）和对应的字符字典文件，可快速支持英文、日文等语言。

2. 工业级部署建议

模型量化：使用PaddleSlim将FP32模型转为INT8，减少内存占用。
容器化部署：将应用打包为Docker镜像，便于跨环境迁移。
日志系统：集成spdlog等库记录推理耗时、错误信息。

3. 代码结构优化

推荐将OCR功能封装为类，例如：

class PaddleOCREngine {
public:
    PaddleOCREngine(const std::string& det_path, const std::string& rec_path);
    std::vector<std::string> Recognize(const cv::Mat& img);
private:
    std::shared_ptr<paddle_infer::Predictor> det_predictor_;
    std::shared_ptr<paddle_infer::Predictor> rec_predictor_;
};

六、总结与资源推荐

通过本文的步骤，开发者可在Windows环境下快速完成PaddleOCR的C++部署。关键点包括：正确配置依赖库、合理组织模型与配置文件、优化推理性能。进一步学习可参考：

PaddleOCR官方GitHub仓库
Paddle Inference API文档
OpenCV图像处理教程

实际开发中，建议从CPU版本开始调试，逐步引入GPU加速，并通过性能分析工具（如Visual Studio的Profiler）定位瓶颈。