OpenCV Tutorials 04 - 图像阈值和平滑处理

在计算机视觉任务中，图像预处理是提升算法鲁棒性的关键步骤。OpenCV作为最流行的计算机视觉库，提供了丰富的图像阈值处理（Thresholding）和平滑处理（Smoothing）工具。本教程将系统讲解这两种技术的原理、实现方法及实际应用场景。

一、图像阈值处理：从灰度到二值的转换艺术

1.1 阈值处理的核心原理

图像阈值处理是通过设定阈值将灰度图像转换为二值图像的过程，其数学表达式为：
[
dst(x,y) =
\begin{cases}
maxVal & \text{if } src(x,y) > thresh \
0 & \text{otherwise}
\end{cases}
]
其中，src(x,y)是输入像素值，thresh是阈值，maxVal是满足条件时赋予的新值。

1.2 OpenCV中的阈值类型详解

OpenCV提供了5种核心阈值方法，通过cv2.threshold()函数实现：

import cv2
import numpy as np
img = cv2.imread('input.jpg', 0)  # 以灰度模式读取
# 全局阈值处理
ret, thresh1 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)
ret, thresh2 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY_INV)
ret, thresh3 = cv2.threshold(img, 127, 255, cv2.THRESH_TRUNC)
ret, thresh4 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO)
ret, thresh5 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO_INV)

THRESH_BINARY：经典二值化，超过阈值设为maxVal，否则为0
THRESH_BINARY_INV：反向二值化
THRESH_TRUNC：超过阈值部分截断为阈值
THRESH_TOZERO：低于阈值部分设为0
THRESH_TOZERO_INV：高于阈值部分设为0

1.3 自适应阈值处理

对于光照不均的图像，全局阈值效果不佳。OpenCV提供了cv2.adaptiveThreshold()函数：

# 均值自适应阈值
thresh_mean = cv2.adaptiveThreshold(
    img, 255, cv2.ADAPTIVE_THRESH_MEAN_C, 
    cv2.THRESH_BINARY, 11, 2
)
# 高斯自适应阈值
thresh_gauss = cv2.adaptiveThreshold(
    img, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, 
    cv2.THRESH_BINARY, 11, 2
)

关键参数说明：

blockSize：邻域大小（奇数）
C：从均值或加权均值中减去的常数

1.4 Otsu自动阈值法

Otsu算法通过最大化类间方差自动确定最佳阈值：

ret, otsu_thresh = cv2.threshold(
    img, 0, 255, 
    cv2.THRESH_BINARY + cv2.THRESH_OTSU
)

该方法特别适用于双峰直方图的图像，如文档扫描场景。

二、图像平滑处理：噪声抑制与细节保留的平衡

2.1 噪声类型与平滑需求

图像噪声主要分为：

高斯噪声：服从正态分布
椒盐噪声：随机黑白点
泊松噪声：光子计数噪声

平滑处理需在噪声抑制和边缘保持间取得平衡。

2.2 均值滤波

最基础的平滑方法，通过邻域平均实现：

blur = cv2.blur(img, (5,5))  # 5x5核

特点：计算简单但会导致边缘模糊。

2.3 高斯滤波

考虑空间距离的高斯加权平均：

gaussian_blur = cv2.GaussianBlur(img, (5,5), 0)

参数说明：

(5,5)：核大小（必须为正奇数）
0：高斯核标准差（0表示根据核大小自动计算）

2.4 中值滤波

对椒盐噪声特别有效：

median = cv2.medianBlur(img, 5)  # 5x5核

原理：用邻域中值替换中心像素值。

2.5 双边滤波

同时考虑空间距离和像素值相似性：

bilateral = cv2.bilateralFilter(img, 9, 75, 75)

参数说明：

9：邻域直径
75：颜色空间标准差
75：坐标空间标准差

三、实践案例：文档图像预处理

3.1 完整处理流程

def preprocess_document(img_path):
    # 1. 读取图像
    img = cv2.imread(img_path, 0)
    # 2. 高斯平滑去噪
    blurred = cv2.GaussianBlur(img, (5,5), 0)
    # 3. 自适应阈值处理
    thresh = cv2.adaptiveThreshold(
        blurred, 255, 
        cv2.ADAPTIVE_THRESH_GAUSSIAN_C, 
        cv2.THRESH_BINARY, 11, 2
    )
    # 4. 形态学开运算去除小噪点
    kernel = np.ones((3,3), np.uint8)
    processed = cv2.morphologyEx(thresh, cv2.MORPH_OPEN, kernel)
    return processed

3.2 效果对比分析

处理步骤	效果说明
原始图像	含噪声和光照不均
高斯平滑	抑制高频噪声
自适应阈值	适应局部光照变化
形态学处理	去除孤立噪点

四、性能优化建议

核大小选择：
- 通常选择3×3、5×5或7×7的奇数核
- 大核处理速度慢但平滑效果强

实时处理优化：

# 使用积分图像加速均值滤波
integral = cv2.integral(img)
# 通过积分图像快速计算区域和

多线程处理：
- 对大图像可分块处理
- 使用OpenCV的UMat进行GPU加速

五、常见问题解决方案

阈值处理后文字断裂：

解决方案：先进行形态学闭运算

kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (3,3))
closed = cv2.morphologyEx(thresh, cv2.MORPH_CLOSE, kernel)

平滑处理导致边缘模糊：
- 解决方案：改用双边滤波或导向滤波
自适应阈值效果不稳定：
- 解决方案：调整blockSize和C参数，通常blockSize在11-21之间

六、进阶应用方向

结合边缘检测：

# 先平滑后Canny边缘检测
edges = cv2.Canny(gaussian_blur, 50, 150)

在深度学习中的应用：
- 作为数据增强手段
- 预处理输入图像提升模型鲁棒性

实时视频处理：

cap = cv2.VideoCapture(0)
while True:
    ret, frame = cap.read()
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
    processed = cv2.adaptiveThreshold(
        gray, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C,
        cv2.THRESH_BINARY, 11, 2
    )
    cv2.imshow('Processed', processed)
    if cv2.waitKey(1) == ord('q'):
        break

本教程系统讲解了OpenCV中图像阈值处理和平滑处理的核心技术，通过理论解析、代码实现和案例分析，帮助开发者掌握从基础到进阶的图像预处理方法。实际应用中，应根据具体场景选择合适的算法组合，并在效果和性能间取得最佳平衡。

OpenCV Tutorials 04：图像阈值与平滑处理全解析