基于Python的车牌识别系统设计与实现

车牌识别（License Plate Recognition, LPR）作为计算机视觉领域的典型应用，广泛应用于智慧交通、停车场管理、安防监控等场景。本文将系统阐述如何利用Python及相关开源库构建高效的车牌识别系统，从基础图像处理到深度学习模型应用，提供完整的实现方案。

一、技术架构与核心组件

车牌识别系统通常包含四个核心模块：图像采集、车牌定位、字符分割、字符识别。基于Python的实现方案可选用以下技术栈：

图像处理库：OpenCV（核心图像操作）
深度学习框架：TensorFlow/Keras或PyTorch（可选）
辅助工具：NumPy（数值计算）、Pillow（图像处理）
OCR引擎：Tesseract OCR（传统方法）或CRNN（深度学习方法）

1.1 系统流程设计

graph TD
    A[输入图像] --> B[图像预处理]
    B --> C[车牌定位]
    C --> D[字符分割]
    D --> E[字符识别]
    E --> F[输出结果]

二、图像预处理关键技术

预处理阶段直接影响后续定位精度，需完成以下操作：

2.1 灰度化与噪声去除

import cv2
def preprocess_image(img_path):
    # 读取图像
    img = cv2.imread(img_path)
    # 转换为灰度图
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    # 高斯滤波降噪
    blurred = cv2.GaussianBlur(gray, (5,5), 0)
    return blurred

2.2 边缘检测与二值化

采用Sobel算子增强垂直边缘，配合自适应阈值处理：

def edge_detection(img):
    # Sobel垂直边缘检测
    sobelx = cv2.Sobel(img, cv2.CV_64F, 1, 0, ksize=3)
    abs_sobel = cv2.convertScaleAbs(sobelx)
    # 自适应阈值二值化
    binary = cv2.adaptiveThreshold(
        abs_sobel, 255, 
        cv2.ADAPTIVE_THRESH_GAUSSIAN_C, 
        cv2.THRESH_BINARY, 11, 2
    )
    return binary

三、车牌定位实现方案

3.1 基于形态学操作的传统方法

通过连通域分析定位车牌区域：

def locate_license_plate(binary_img):
    # 形态学闭运算连接边缘
    kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (17,5))
    closed = cv2.morphologyEx(binary_img, cv2.MORPH_CLOSE, kernel)
    # 查找轮廓
    contours, _ = cv2.findContours(
        closed.copy(), cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE
    )
    # 筛选符合车牌特征的轮廓
    candidates = []
    for cnt in contours:
        rect = cv2.minAreaRect(cnt)
        box = cv2.boxPoints(rect)
        box = np.int0(box)
        # 筛选长宽比在2-5之间的区域
        width, height = rect[1]
        aspect_ratio = max(width, height)/min(width, height)
        if 2 < aspect_ratio < 5:
            candidates.append((box, rect[2]))
    return candidates

3.2 基于深度学习的定位方法

使用预训练的YOLOv5模型进行车牌检测：

# 需提前安装ultralytics库
from ultralytics import YOLO
def deep_learning_locate(img_path):
    model = YOLO("yolov5s.pt")  # 使用预训练模型
    results = model(img_path)
    plates = []
    for result in results:
        for box in result.boxes.data.tolist():
            x1, y1, x2, y2, score, class_id = box[:6]
            plates.append((int(x1), int(y1), int(x2), int(y2)))
    return plates

四、字符分割与识别

4.1 字符分割技术

采用投影法结合连通域分析：

def segment_characters(plate_img):
    # 垂直投影分割
    hist = np.sum(plate_img, axis=0)
    threshold = hist.max() * 0.1
    char_regions = []
    start = 0
    for i, val in enumerate(hist):
        if val > threshold and start == 0:
            start = i
        elif val <= threshold and start != 0:
            char_regions.append((start, i))
            start = 0
    # 提取字符ROI
    chars = []
    for (start, end) in char_regions:
        char = plate_img[:, start:end]
        chars.append(char)
    return chars

4.2 字符识别方案

方案一：Tesseract OCR

import pytesseract
from PIL import Image
def tesseract_recognize(char_img):
    # 转换为PIL图像并二值化
    pil_img = Image.fromarray(char_img)
    text = pytesseract.image_to_string(
        pil_img, 
        config='--psm 10 --oem 3 -c tessedit_char_whitelist=0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ'
    )
    return text.strip()

方案二：CRNN深度学习模型

# 假设已训练好CRNN模型
def crnn_recognize(char_imgs):
    # 批量处理字符图像
    inputs = preprocess_batch(char_imgs)
    predictions = crnn_model.predict(inputs)
    # 解码预测结果
    recognized_texts = []
    for pred in predictions:
        char_indices = np.argmax(pred, axis=1)
        text = decode_prediction(char_indices)  # 自定义解码函数
        recognized_texts.append(text)
    return recognized_texts

五、性能优化与工程实践

5.1 实时性优化

模型量化：将浮点模型转为INT8，推理速度提升3-5倍
硬件加速：使用OpenVINO或TensorRT优化推理
多线程处理：图像采集与识别并行化

5.2 准确率提升策略

数据增强：在训练集中加入不同光照、角度的车牌样本
难例挖掘：收集识别错误的样本进行针对性训练
后处理规则：添加车牌格式校验（如中国车牌规则）

5.3 完整实现示例

def complete_lpr_pipeline(img_path):
    # 1. 预处理
    processed = preprocess_image(img_path)
    # 2. 车牌定位（混合方法）
    try:
        dl_plates = deep_learning_locate(img_path)
    except:
        dl_plates = []
    if not dl_plates:
        binary = edge_detection(processed)
        candidates = locate_license_plate(binary)
        # 转换为矩形坐标...
    else:
        candidates = [convert_yolo_to_rect(plate) for plate in dl_plates]
    # 3. 字符识别
    results = []
    for box in candidates[:1]:  # 取最可能的车牌
        plate_roi = extract_roi(img_path, box)
        chars = segment_characters(plate_roi)
        texts = []
        for char in chars:
            text = crnn_recognize([char])[0] or tesseract_recognize(char)
            texts.append(text)
        results.append("".join(texts))
    return results[0] if results else None

六、应用场景与扩展方向

智慧交通：与卡口系统集成实现自动收费
安防监控：结合人脸识别构建车辆追踪系统
移动端应用：通过ONNX Runtime部署到手机端
云服务集成：封装为REST API提供SaaS服务

当前行业常见技术方案中，深度学习模型（如YOLO+CRNN组合）在准确率和鲁棒性上已显著优于传统方法，但在嵌入式设备部署时仍需权衡模型大小与精度。建议根据实际场景选择技术方案：固定摄像头场景可采用轻量级模型，移动场景需重点优化推理速度。

通过系统化的图像处理流程和深度学习模型结合，Python可实现高效准确的车牌识别系统。实际开发中需特别注意数据质量、模型选择和工程优化三个关键环节，这些因素直接决定系统的最终性能。