计算机视觉教程2-2：详解图像滤波算法

一、图像滤波的核心价值与分类

图像滤波是计算机视觉预处理的核心环节，其核心目标是通过数学变换抑制噪声、增强特征或平滑图像，为后续的目标检测、分割等任务提供高质量输入。根据处理方式的不同，滤波算法可分为线性滤波与非线性滤波两大类：

线性滤波：基于加权求和的卷积操作，如均值滤波、高斯滤波，适用于高斯噪声等加性噪声的抑制。
非线性滤波：通过像素邻域的统计特性进行非线性变换，如中值滤波、双边滤波，对椒盐噪声等脉冲噪声效果显著。

二、线性滤波算法详解

1. 均值滤波：简单平滑的代价

均值滤波通过计算邻域内像素的平均值替代中心像素值，数学表达式为：
[
g(x,y) = \frac{1}{M} \sum_{(i,j)\in N} f(i,j)
]
其中 (N) 为邻域（如3×3、5×5），(M) 为邻域像素总数。优点是计算高效，缺点是过度平滑导致边缘模糊。

代码示例（OpenCV实现）：

import cv2
import numpy as np
# 读取图像并添加高斯噪声
img = cv2.imread('input.jpg', 0)
noise = np.random.normal(0, 25, img.shape).astype(np.uint8)
noisy_img = cv2.add(img, noise)
# 应用均值滤波
kernel_size = 3
mean_filtered = cv2.blur(noisy_img, (kernel_size, kernel_size))

2. 高斯滤波：权重分配的艺术

高斯滤波通过二维高斯核分配邻域权重，中心像素权重最高，边缘像素权重随距离衰减。其核函数为：
[
G(x,y) = \frac{1}{2\pi\sigma^2} e^{-\frac{x^2+y^2}{2\sigma^2}}
]
优势在于保留更多边缘信息，参数选择：核大小（通常3×3或5×5）和标准差 (\sigma)（控制平滑强度）。

代码示例：

# 应用高斯滤波
sigma = 1.5
gaussian_filtered = cv2.GaussianBlur(noisy_img, (kernel_size, kernel_size), sigma)

三、非线性滤波算法突破

1. 中值滤波：脉冲噪声的克星

中值滤波将邻域像素值排序后取中值，对椒盐噪声（如传感器故障产生的黑白点）效果极佳。实现要点：

邻域大小选择：3×3适用于细粒度噪声，5×5适用于密集噪声。
边界处理：采用复制边界或镜像填充。

代码示例：

# 添加椒盐噪声
def add_salt_pepper_noise(image, prob):
    output = np.copy(image)
    num_salt = np.ceil(prob * image.size * 0.5)
    coords = [np.random.randint(0, i-1, int(num_salt)) for i in image.shape]
    output[coords[0], coords[1]] = 255  # 盐噪声
    # 类似添加椒噪声...
    return output
salt_pepper_img = add_salt_pepper_noise(img, 0.05)
median_filtered = cv2.medianBlur(salt_pepper_img, kernel_size)

2. 双边滤波：保边去噪的平衡

双边滤波结合空间邻近度与像素相似度，公式为：
[
BF[I]p = \frac{1}{W_p} \sum{q \in S} G{\sigma_s}(||p-q||) G{\sigmar}(|I_p - I_q|) I_q
]
其中 (G{\sigmas}) 为空间高斯核，(G{\sigma_r}) 为颜色高斯核。参数调优建议：

(\sigma_s) 控制空间权重衰减速度（通常5-15）。
(\sigma_r) 控制颜色相似度阈值（通常20-75）。

代码示例：

# 应用双边滤波
diameter = 7
sigma_color = 75
sigma_space = 75
bilateral_filtered = cv2.bilateralFilter(noisy_img, diameter, sigma_color, sigma_space)

四、工程化应用建议

噪声类型诊断：
- 高斯噪声：优先高斯滤波。
- 椒盐噪声：中值滤波。
- 混合噪声：双边滤波或组合滤波。
参数优化策略：
- 通过SSIM（结构相似性）指标量化滤波效果。
- 使用网格搜索或贝叶斯优化自动调参。
实时性优化：
- 分离滤波：将二维高斯核分解为两个一维核。
- 积分图加速：均值滤波可利用积分图实现O(1)计算。

五、前沿发展方向

深度学习滤波：
- 使用CNN学习自适应滤波核（如DnCNN去噪网络）。
- 结合注意力机制增强特征保留能力。
多尺度融合：
- 金字塔滤波：在不同尺度下进行滤波并融合结果。
- 小波变换：在频域实现选择性滤波。

总结

图像滤波算法的选择需综合考虑噪声类型、计算资源与后续任务需求。线性滤波适合快速预处理，非线性滤波在边缘保留上更具优势，而深度学习滤波正逐步成为研究热点。开发者可通过OpenCV等工具快速验证算法效果，并结合实际场景进行参数优化。掌握这些核心算法，将为计算机视觉系统的鲁棒性奠定坚实基础。

计算机视觉进阶：图像滤波算法全解析

计算机视觉教程2-2：详解图像滤波算法

一、图像滤波的核心价值与分类

二、线性滤波算法详解

1. 均值滤波：简单平滑的代价

2. 高斯滤波：权重分配的艺术

三、非线性滤波算法突破

1. 中值滤波：脉冲噪声的克星

2. 双边滤波：保边去噪的平衡

四、工程化应用建议

五、前沿发展方向

总结