一、语音信号加噪的核心原理与技术实现

语音信号加噪的本质是在原始音频中叠加干扰成分，模拟真实环境下的噪声污染。这一过程需要精确控制噪声类型、信噪比（SNR）及叠加方式，为后续降噪算法提供可量化的测试基准。

1.1 噪声类型与生成方法

MATLAB提供多种噪声生成函数，可根据场景需求选择：

高斯白噪声：awgn()函数直接添加，适用于通信信道模拟

clean_speech = audioread('speech.wav');
noisy_speech = awgn(clean_speech, 10, 'measured'); % 添加10dB SNR的高斯噪声

有色噪声：通过滤波器设计生成特定频谱特性的噪声

fs = 8000; % 采样率
t = 0:1/fs:1;
pink_noise = filter(1, [1 -0.7], randn(size(t))); % 粉红噪声生成

环境噪声库：加载预录制的噪声样本（如交通噪声、办公室噪声）

[noise, fs_noise] = audioread('traffic_noise.wav');
% 调整噪声长度与采样率
if fs_noise ~= fs
  noise = resample(noise, fs, fs_noise);
end

1.2 信噪比（SNR）控制技术

精确控制SNR是加噪的关键，推荐使用能量归一化方法：

function noisy_sig = add_noise_with_snr(clean_sig, noise_sig, target_snr)
    % 计算信号能量
    sig_power = sum(clean_sig.^2);
    % 调整噪声能量
    noise_power = sum(noise_sig.^2);
    scale_factor = sqrt(sig_power / (noise_power * 10^(target_snr/10)));
    scaled_noise = noise_sig * scale_factor;
    % 叠加噪声
    noisy_sig = clean_sig + scaled_noise;
end

该方法通过动态调整噪声幅度，确保实际SNR与目标值误差小于0.1dB。

二、语音降噪算法的MATLAB实现

降噪算法需在消除噪声与保留语音特征间取得平衡，以下介绍三种主流方法。

2.1 谱减法及其改进实现

传统谱减法通过估计噪声谱并从带噪谱中减去实现降噪：

function [enhanced_sig, noise_est] = spectral_subtraction(noisy_sig, fs, frame_len, overlap)
    % 参数设置
    nfft = 2^nextpow2(frame_len);
    win = hamming(frame_len);
    step = frame_len - overlap;
    % 分帧处理
    frames = buffer(noisy_sig, frame_len, overlap, 'nodelay');
    num_frames = size(frames, 2);
    % 初始化噪声估计
    noise_est = zeros(nfft/2+1, 1);
    % 逐帧处理
    for i = 1:num_frames
        % 加窗与FFT
        windowed = frames(:,i) .* win;
        spec = abs(fft(windowed, nfft)).^2 / nfft;
        % 噪声估计（前5帧为纯噪声）
        if i <= 5
            noise_est = noise_est + spec(1:nfft/2+1);
        end
        % 谱减
        if i > 5
            alpha = 2; % 过减因子
            beta = 0.002; % 谱底参数
            enhanced_spec = max(spec(1:nfft/2+1) - alpha*noise_est/5, beta*noise_est);
            % 重建时域信号（此处省略IFFT与重叠相加步骤）
        end
    end
end

改进方向：

动态噪声估计更新
非线性谱减函数
残余噪声抑制

2.2 维纳滤波的MATLAB实现

维纳滤波通过最小化均方误差实现最优滤波：

function enhanced_sig = wiener_filter(noisy_sig, fs, snr_est)
    % 参数设置
    frame_len = 256;
    overlap = 128;
    nfft = 512;
    win = hamming(frame_len);
    % 预处理
    frames = buffer(noisy_sig, frame_len, overlap);
    num_frames = size(frames, 2);
    enhanced_frames = zeros(size(frames));
    % 逐帧处理
    for i = 1:num_frames
        windowed = frames(:,i) .* win;
        noisy_spec = fft(windowed, nfft);
        % 噪声功率谱估计（简化版）
        noise_psd = abs(noisy_spec(1:nfft/2+1)).^2 / (10^(snr_est/10));
        % 先验SNR估计
        gamma = abs(noisy_spec(1:nfft/2+1)).^2 ./ (noise_psd + eps);
        % 维纳滤波器
        H = gamma ./ (gamma + 1);
        enhanced_spec = noisy_spec .* [H; conj(flipud(H(2:end-1)))];
        enhanced_frames(:,i) = real(ifft(enhanced_spec, nfft));
    end
    % 重叠相加
    enhanced_sig = overlap_add(enhanced_frames, frame_len, overlap);
end

关键优化点：

噪声功率谱的动态跟踪
先验SNR估计的平滑处理
滤波器系数的频域修正

2.3 小波阈值降噪的MATLAB实现

小波变换通过时频局部化特性实现噪声分离：

function enhanced_sig = wavelet_denoise(noisy_sig, wavelet_name, level)
    % 小波分解
    [C, L] = wavedec(noisy_sig, level, wavelet_name);
    % 阈值处理
    threshold = wthrmngr('dw1ddenoLVL','sqtwolog',C,L);
    clean_C = wthresh(C, 's', threshold);
    % 小波重构
    enhanced_sig = waverec(clean_C, L, wavelet_name);
end

参数选择建议：

小波基：db4或sym8适用于语音信号
分解层数：3-5层
阈值规则：sqtwolog（通用）或heursure（自适应）

三、性能评估与优化实践

3.1 客观评估指标

MATLAB提供多种语音质量评估函数：

% 信噪比计算
[clean_sig, fs] = audioread('clean.wav');
[noisy_sig, ~] = audioread('noisy.wav');
snr_before = 10*log10(var(clean_sig)/var(noisy_sig-clean_sig));
% PESQ评分（需安装PESQ工具箱）
pesq_score = pesq(clean_sig, noisy_sig, fs);
% 短时客观可懂度（STOI）
stoi_score = stoi(clean_sig, noisy_sig, fs);

3.2 性能优化技巧

实时处理优化：
- 使用定点运算加速（fi对象）
- 避免重复计算（预计算窗函数、FFT矩阵）
- 采用重叠保留法减少计算量
算法选择建议：
- 低SNR场景：维纳滤波
- 非平稳噪声：小波变换
- 实时系统：简化谱减法
参数调优方法：
- 网格搜索法优化阈值参数
- 遗传算法优化滤波器系数
- 交叉验证评估参数鲁棒性

四、完整处理流程示例

% 1. 读取语音文件
[clean_speech, fs] = audioread('input.wav');
% 2. 生成噪声
noise = 0.5*randn(size(clean_speech)); % 高斯噪声
% 3. 加噪处理（10dB SNR）
noisy_speech = add_noise_with_snr(clean_speech, noise, 10);
% 4. 降噪处理（维纳滤波）
enhanced_speech = wiener_filter(noisy_speech, fs, 10);
% 5. 效果评估
original_snr = 10*log10(var(clean_speech)/var(noise));
processed_snr = 10*log10(var(clean_speech)/var(enhanced_speech-clean_speech));
fprintf('原始SNR: %.2fdB, 处理后SNR: %.2fdB\n', original_snr, processed_snr);
% 6. 保存结果
audiowrite('noisy.wav', noisy_speech, fs);
audiowrite('enhanced.wav', enhanced_speech, fs);

五、应用场景与扩展方向

通信系统仿真：模拟信道噪声对语音传输的影响
助听器算法开发：为听力受损用户提供降噪方案
语音识别预处理：提升噪声环境下的识别准确率
多媒体处理：改善录音质量，消除背景噪声

未来发展方向：

深度学习降噪模型（可结合MATLAB的Deep Learning Toolbox）
实时GPU加速处理
多通道阵列信号降噪
深度学习与传统方法的混合架构

通过系统掌握上述技术，开发者能够构建从噪声模拟到信号恢复的完整处理流程，为各类语音应用提供高质量的解决方案。

MATLAB中语音信号加噪与降噪的完整实现指南