引言：实时光线追踪的”噪点困境”

实时光线追踪（Real-Time Ray Tracing）作为图形渲染领域的革命性技术，通过模拟光线物理传播路径，实现了逼真的全局光照、反射和阴影效果。然而，其核心矛盾在于：为保证实时性（≥30FPS），每帧仅能投射有限数量的光线样本，导致渲染结果呈现明显的颗粒状噪点（Monte Carlo Noise）。这种噪点不仅破坏视觉沉浸感，更可能掩盖关键细节（如高光反射、半透明材质）。

降噪技术（Denoising）因此成为实时光线追踪的”最后一道防线”，其目标是在不显著增加计算成本的前提下，将低样本数的噪声图像恢复为接近无限样本的高质量结果。本文将系统梳理降噪技术的核心原理、主流算法及工程实现要点。

一、噪声来源与数学本质

1.1 蒙特卡洛积分的噪声特性

实时光线追踪的本质是蒙特卡洛积分：通过随机采样估计光照贡献。例如，直接光照计算可表示为：

L_o(p,ω_o) ≈ (1/N) * Σ[f_r(p,ω_i,ω_o)*L_i(p,ω_i)*cosθ_i / p(ω_i)]

其中N为采样数，p(ω_i)为采样概率密度函数。当N较小时，积分结果呈现方差主导的噪声，其统计特性表现为：

噪声幅度与信号强度正相关（高光区域噪声更强）
噪声频率与采样密度成反比（低采样区域噪声更粗糙）

1.2 噪声的空间相关性

实时光追噪声具有显著的空间-波长双重相关性：

空间维度：相邻像素的噪声模式相似（因共享部分采样路径）
波长维度：RGB通道噪声存在相关性（如金属反射的高光同时影响三通道）

这种特性为时空降噪算法提供了理论基础——通过利用邻域信息可更高效地估计真实信号。

二、降噪算法分类与演进

2.1 空间降噪算法

2.1.1 基于双边滤波的改进

传统双边滤波通过空间距离和颜色相似性加权，但直接应用于光追噪声会导致细节丢失。改进方案包括：

非局部均值（NLM）：搜索全局相似块进行加权平均
引导滤波（GF）：利用辅助缓冲（如法线、深度）构建引导图
加权最小二乘（WLS）：通过优化框架保持边缘

实现示例（简化版WLS）：

// 构建拉普拉斯矩阵L
for each pixel p {
    for each neighbor q in 4-connected {
        float w = exp(-||C_p - C_q||^2 / σ_c^2) * 
                 exp(-||p - q||^2 / σ_s^2);
        L(p,q) = -w;
        L(p,p) += w;
    }
}
// 求解线性系统 Ax = b（A=L, b=原始图像）

2.1.2 深度学习降噪

卷积神经网络（CNN）通过学习噪声-干净图像对的映射关系实现降噪。典型网络结构包括：

U-Net：编码器-解码器结构，适合低分辨率输入
SRNet：超分辨率框架，同时处理降噪和抗锯齿
多尺度特征融合：结合不同感受野的特征

训练数据生成：

# 合成训练对（伪代码）
def generate_pair():
    scene = load_scene()
    clean = render_high_samples(scene)  # N=1024
    noisy = render_low_samples(scene)   # N=16
    return noisy, clean

2.2 时空降噪算法

2.2.1 运动补偿与时间累积

通过光流估计将历史帧变换到当前视角，实现时间维度的样本累积。关键步骤包括：

光流计算：使用FLowNet等网络估计像素运动
重投影：将历史帧像素映射到当前帧
时间混合：指数移动平均（EMA）融合多帧

// 时间混合伪代码
float alpha = 0.1;  // 时间权重
vec3 current_color = render_current_frame();
vec3 history_color = reproject_history_frame();
vec3 mixed_color = alpha * current_color + (1-alpha) * history_color;

2.2.2 联合时空滤波

更先进的方案如SVGF（Spatiotemporal Variance-Guided Filtering），其核心思想是：

估计每个像素的方差（通过邻域样本统计）
根据方差动态调整滤波核大小
结合时间重投影结果进行加权

方差估计公式：

Var(p) = (1/(N-1)) * Σ[(L_i - μ)^2], μ=(1/N)*ΣL_i

2.3 分层降噪策略

现代引擎（如UE5的Lumen）采用分层渲染+分层降噪：

粗粒度层：低分辨率光追+强降噪（用于环境光遮蔽）
中粒度层：中等分辨率+中等降噪（用于漫反射）
细粒度层：高分辨率+轻量降噪（用于高光）

这种策略在性能与质量间取得平衡，例如在PS5上可实现：

粗粒度层：512x512，16SPP，降噪时间0.5ms
细粒度层：1920x1080，4SPP，降噪时间1.2ms

三、工程实现挑战与优化

3.1 性能瓶颈分析

降噪模块的典型性能分布：

空间滤波：40%（主要消耗在邻域访问）
时间重投影：30%（光流计算开销大）
内存带宽：20%（多帧数据访问）
其他：10%

优化方向：

使用共享内存缓存邻域数据（减少全局内存访问）
对静止区域跳过时间滤波（通过运动检测）
采用半精度浮点计算（FP16）

3.2 质量评估指标

除主观视觉评估外，需量化指标：

PSNR（峰值信噪比）：反映整体误差
SSIM（结构相似性）：评估结构保持能力
LPIPS（感知损失）：匹配人类视觉感知

推荐测试场景：

动态光源变化（测试时间稳定性）
高频细节区域（测试空间保持性）
纯色区域（测试噪声残留）

3.3 混合渲染方案

纯光追降噪在移动端仍不现实，混合方案成为主流：

光追+光栅化：用光追处理高光/反射，光栅化处理漫反射
分级降噪：根据物体重要性动态调整SPP（如角色4SPP，背景1SPP）
后处理注入：将降噪结果作为屏幕空间效果与其他后处理（如Bloom）复合

四、未来趋势与研究方向

4.1 神经辐射场（NeRF）的启示

NeRF通过隐式神经表示实现高质量新视角合成，其核心思想可迁移至降噪：

用神经网络学习场景的辐射场先验
将降噪问题转化为条件生成问题

4.2 物理可解释的降噪

当前深度学习模型缺乏物理约束，未来可能结合：

双向路径追踪（BDPT）的物理模型
微表面理论的先验知识
能量守恒约束

4.3 实时路径追踪的终极目标

随着硬件进步（如RTX 40系的光追单元），降噪可能向两极发展：

超低样本降噪：1SPP→无噪（如NVIDIA的DLSS 3.5）
高样本免降噪：64SPP以上直接渲染（需光追性能提升10倍）

结论：降噪技术的战略价值

实时光线追踪降噪不仅是技术补救手段，更是渲染架构设计的核心环节。它决定了：

硬件光追单元的利用率（如何用最少样本获得可用结果）
渲染管线的灵活性（是否支持动态光照变化）
最终画面的艺术表现力（能否呈现电影级质感）

对于开发者，建议从以下维度构建降噪能力：

分层实施：先实现空间降噪，再逐步加入时间维度
数据驱动：建立自有场景的噪声-干净图像对库
硬件适配：针对不同平台（PC/主机/移动端）优化算法
质量监控：建立自动化测试流程持续跟踪降噪效果

实时光线追踪降噪的演进，本质是计算效率与视觉真实感的永恒博弈。随着AI与硬件的协同发展，这场博弈正不断逼近物理真实的极限。

GAMES202实时渲染深度解析：实时光线追踪降噪技术全览