一、实时光线追踪的噪声问题与挑战

实时光线追踪通过模拟光线路径实现全局光照效果，但受限于单帧采样数不足，直接渲染结果会呈现明显的蒙特卡洛噪声。这种噪声表现为高频的像素级波动，尤其在间接光照、焦散、半透明材质等复杂场景中更为显著。噪声的根源在于光线采样过程的随机性：每帧独立的光线投射方向、着色点选择和材质交互均存在统计波动。

在实时渲染的毫秒级帧预算下，单帧采样数通常被限制在1-4 SPP（Samples Per Pixel），远低于离线渲染的数百SPP。这种低采样条件导致噪声无法通过简单增加样本消除，必须依赖后处理降噪技术。噪声的时空特性进一步复杂化问题：空间上表现为相邻像素的随机差异，时间上表现为帧间闪烁。

二、时域降噪（Temporal Denoising）技术解析

时域降噪的核心思想是利用历史帧信息提升当前帧质量，其典型实现为TAA（Temporal Anti-Aliasing）的扩展应用。算法流程可分为三步：

运动矢量估计：通过屏幕空间或几何级运动矢量计算像素在前后帧的对应位置

// 屏幕空间运动矢量计算示例
vec2 ComputeMotionVector(vec2 uv, mat4 prevViewProj, mat4 currViewProj) {
    vec4 ndc = vec4(uv * 2.0 - 1.0, 0.0, 1.0);
    vec4 worldPos = inverse(currViewProj) * ndc;
    worldPos /= worldPos.w;
    vec4 prevNDC = prevViewProj * worldPos;
    prevNDC = prevNDC * 0.5 + 0.5; // 转换回[0,1]范围
    return uv - prevNDC.xy;
}

历史帧混合：将当前帧颜色与历史帧颜色按权重混合

// 指数移动平均混合
float temporalWeight = 0.9; // 可调参数
vec3 denoisedColor = mix(historyColor, currentColor, temporalWeight);

异常值抑制：通过方差检测剔除运动矢量错误导致的重影

时域降噪的优势在于可利用多帧信息，理论上可将等效采样数提升10倍以上。但存在三个关键问题：运动矢量误差导致的拖影、静态场景噪声收敛缓慢、动态物体混合权重难以平衡。优化策略包括：

引入速度缓冲区分静态/动态区域
对高方差区域降低时域权重
结合SVO（Sparse Voxel Octree）进行精确运动追踪

三、空域降噪（Spatial Denoising）技术突破

空域降噪通过分析当前帧像素的邻域信息消除噪声，典型方法包括：

非局部均值（NLM）：在相似纹理区域寻找匹配块进行加权平均

// 简化版NLM实现
vec3 NLMFilter(sampler2D tex, vec2 uv, int radius) {
    vec3 sum = vec3(0.0);
    float weightSum = 0.0;
    for (int y = -radius; y <= radius; y++) {
        for (int x = -radius; x <= radius; x++) {
            vec2 offset = vec2(x, y) * texelSize;
            float dist = length(texture(tex, uv + offset).rgb - texture(tex, uv).rgb);
            float weight = exp(-dist * dist / (0.1 * 0.1));
            sum += texture(tex, uv + offset).rgb * weight;
            weightSum += weight;
        }
    }
    return sum / weightSum;
}

联合双边滤波（JBF）：结合空间距离和颜色相似度进行加权
深度学习降噪：使用轻量级CNN（如SVGF网络）进行端到端降噪

空域降噪的关键挑战在于：

边缘保持：需区分真实细节与噪声
性能平衡：需在移动端实现1ms以内的处理时间
材质适应性：对金属/非金属、粗糙/光滑表面需差异化处理

最新研究进展包括：

引入法线/深度辅助特征提升边缘检测精度
采用分层滤波架构（先降噪后锐化）
结合G-Buffer信息进行语义感知降噪

四、时空联合降噪框架与优化实践

现代实时渲染引擎普遍采用时空联合降噪方案，典型流程如下：

初始降噪：对原始光线追踪结果进行时域混合（TAA-like）
空域细化：对时域结果进行边缘感知的空域滤波
质量评估：通过方差/梯度分析自适应调整滤波参数
最终合成：与光栅化结果进行混合（如NVIDIA的DLSS 3.5）

优化实践要点：

分层处理策略：
- 对高光/反射等高频区域优先使用时域信息
- 对漫反射等低频区域加强空域滤波
- 对动态物体采用保守的时域混合

参数自适应控制：

// 根据场景复杂度动态调整降噪强度
float AdjustDenoisingStrength(float sceneVariance) {
    float baseStrength = 0.7;
    float varianceThreshold = 0.2;
    return mix(baseStrength * 0.5, baseStrength * 1.5, 
              smoothstep(0.0, varianceThreshold, sceneVariance));
}

混合渲染架构：
- 对主要光照使用光线追踪
- 对次要效果（如AO、阴影）使用光栅化
- 通过深度学习超分辨率统一降噪

五、开发者实施建议与工具链

引擎集成方案：
- Unity URP：使用HDRP的Path Tracing + Denoiser
- Unreal Engine：启用Ray Tracing Denoiser插件
- 自定义引擎：基于OptiX或RadeonRays实现
性能优化技巧：
- 对移动端采用固定模式的时域混合
- 使用半精度浮点运算加速计算
- 对静态场景预计算降噪核
调试工具推荐：
- NVIDIA Nsight Graphics：分析降噪各阶段耗时
- RenderDoc：可视化噪声分布
- 自定义调试着色器：输出中间降噪结果
最新研究跟进：
- 关注SIGGRAPH实时渲染论文
- 实验性技术：神经辐射缓存（Neural Radiance Caching）
- 硬件加速：AMD的FSR 3.0与Intel的XeSS降噪集成

六、未来趋势与挑战

实时光线追踪降噪正朝着三个方向发展：

物理可信性：从单纯降噪转向符合物理规律的噪声建模
AI驱动：扩散模型等生成式方法可能替代传统滤波
硬件协同：与光追单元深度集成的专用降噪核心

开发者需持续关注：

光线追踪采样效率的提升（如ReSTIR技术）
降噪与超分辨率的联合优化
跨平台降噪方案的标准化