噪聲估計對語音濾波/語音增強效果好壞很重要。若噪聲估計過小,濾波后有煩人的殘留噪聲;若噪聲估計過高,濾波結果會導致語音失真。我這實驗,根據不同噪聲環境的說話場合,采用可選的其中一種噪聲估計算法配合譜減濾波,濾波后語音清晰度較好。 7種可選噪聲估計算法是:
1.martin 最小跟蹤算法
2.mcra 最小控制遞歸平均算法
3.mcra2 最小控制遞歸平均變體算法
4.imcra 改進的最小控制遞歸平均算法
5.doblinger 連續譜最小跟蹤算法
6.hirsch 加權頻譜平均值算法
7.conn_freq 連接時間_頻率區域算法
參考書:《語音增強--理論與實踐》 作者:羅艾洲
% -----------------------------------------------
% 我編輯的主程序: ns_specsubs.m
close; clear ; clc;
nbits =16;
alpha=0.9; %(冪指數)過減因子,值小則去噪效果增強但失真度增大
FLOOR=0.002;
load methods.mat;
disp('以下是7種噪聲估計算法:');
disp('1:martin, 2:mcra, 3:mcra2, 4:imcra,');
disp('5:doblinger, 6:hirsch, 7:conn_freq');
while 1
i = input('請選擇噪聲估計算法的編號 1~7: (輸入0 則退出) ') ;
if i == 0
return;
end
while (i<0 | i>7 )
i = input('請選擇噪聲估計算法的編號 1~7: (輸入0 則退出) ') ;
end
method =char(meth(i));
[x0,fs] =audioread('signal.mp3'); % 讀入帶人群噪聲的語音文件
x0 = x0(:,1); % 取1聲道
x0 = x0-mean(x0); % 消除直流分量
x0 = x0/max(abs(x0)); % 幅值歸一化
x = x0 ;
head_time =0.9; % 裁掉起始段無語音的秒數,依具體情況調整
head = fs*head_time;
x =x(head+1: length(x));
% 初始化變量 ===============
len=floor(40*fs/1000); % 樣本的大小
if rem(len,2)==1
len=len+1;
end
PERC=50; % 窗口重疊以幀大小的百分比表示
len1=floor(len*PERC/100);
len2=len-len1;
win=hamming(len); % 漢明窗
k=1;
nFFT=2*len;
img=sqrt(-1);
x_old=zeros(len1,1);
Nframes=floor(length(x)/len2)-1;
xfinal=zeros(Nframes*len2,1);
for n=1:Nframes %從第1幀至最末幀,逐幅處理
insign=win.*x(k:k+len-1); % Windowing 加窗
spec=fft(insign,nFFT); % 計算一幀的傅立葉變換
sig=abs(spec);
ns_ps=sig.^2;
% 估計/更新噪聲的psd --------
if n == 1
parameters = initialise_parameters(ns_ps,fs,method);
else
parameters = noise_estimation(ns_ps,method,parameters);
end
noise_ps = parameters.noise_ps;
noise_mu=sqrt(noise_ps); % 噪聲幅值譜
theta=angle(spec); %保存每幀的相位信息
% 計算信噪比:
SNRseg=10*log10(norm(sig,2)^2/norm(noise_mu,2)^2);
% 依據過減因子alpha及信噪比選擇下限系數beta:
if alpha==1.0
beta=berouti1(SNRseg);
%beta = 4 ;
else
beta=berouti2(SNRseg);
end
% 功率譜減去噪:
sub_speech=sig.^alpha - beta*noise_mu.^alpha;
diffw = sub_speech-FLOOR*noise_mu.^alpha;
% 將值朝負無窮方向舍入到最鄰近的整數組件:
z=find(diffw <0);
if~isempty(z)
sub_speech(z)=FLOOR*noise_mu(z).^alpha;
end
% 復數的實部重構確保共軛對稱
sub_speech(nFFT/2+2:nFFT)=flipud(sub_speech(2:nFFT/2));
% 將全幀fft與相位信息相乘:
x_phase=(sub_speech.^(1/alpha)).*(cos(theta)+img*(sin(theta)));
xi=real(ifft(x_phase)); % 逆傅立葉變換
% 重疊相加:
xfinal(k:k+len2-1)=x_old+xi(1:len1);
x_old=xi(1+len1:len);
k=k+len2;
end % EOF for n=1:Nframes
out = xfinal;
N =length(x); %含噪信號長度
Nout=length(out); %濾波后信號長度
if Nout>N
out=out(1:N);
elseif Nout<N
%尾部補零,使輸出信號與與原帶噪信號等長
out=[out; zeros(N-Nout,1)];
end
out=out/max(abs(out)); %輸出信號幅值歸一化
B = 30; % debug的輸入參數,B值依具體情況調整
out2 = debug(out,B); %清除殘留噪聲
% 繪處理前后對比波形圖:
figure('position',[50,50,600,700] );
subplot(4,1,1);
plot(x0(1:length(x0)));
title('原帶噪語音波形');
axis([0 N, -1 1]); grid on;
subplot(4,1,2);
plot(x(1:length(x)));
axis([0 N, -1 1]); grid on;
subplot(4,1,3);
plot(out(1:length(out)));
title([ num2str(method) '估計噪聲算法>譜減降噪后的波形' ]);
axis([0 N, -1 1]); grid on;
subplot(4,1,4);
plot(out2(1:length(out2)));
title('清除殘留噪聲后的波形' );
axis([0 N, -1 1]); grid on;
% sound(x0,fs) ;%播放原帶噪語音
% sound(out,fs) ;%播放去噪后的語音
sound(out2,fs) ;%播放清除殘留噪聲后的語音
end % EOF while 1
% ----------------------------------------
處理前后的語音波形對比圖:
處理前后的語音波形對比圖.jpg (101.69 KB, 下載次數: 50)
下載附件
2023-10-12 13:39 上傳
其它函數及語音文件在壓縮包中:
ns_specsub.zip
(31.55 KB, 下載次數: 9)
2023-10-12 13:43 上傳
點擊文件名下載附件
下載積分: 黑幣 -5
|