首頁>技術中心>技術資訊>隨機共振在強噪聲環境中語音增強應用
隨機共振在強噪聲環境中語音增強應用
發布時間:2017-11-22
1引言
語音增強的主要目標就是從含噪語音中提取盡可能純凈的原始語音,去除語音通信過程中引入的噪聲以及通信設備內部的電噪聲以及其他講話者的干擾,從而改善語音質量,提高語音可懂度。
目前常用的語音增強算法有基于時域的卡爾曼濾波法、梳狀濾波器法[1]等,有基于頻域的頻譜相減法[2],維納濾波法[3]等,它們是通過對噪聲特征進行分析,針對噪聲特征進行最大化的消除,將噪聲作為信號有害的干擾源,然而隨著噪聲信號不斷增強,尤其在強噪聲環境中,傳統的語音增強變得及其困難。
Benzi等在1981年提出隨機共振[4],用以解釋古氣象學中冰川期與暖氣候期周期性交替出現的現象。隨機共振研究方向是非線性隨機問題,它可以通過調節噪聲強度使噪聲中的語音弱信號產生共振得到增強,改變了傳統上去除噪聲從而增強語音信號的理念,目前廣泛的應用于弱故障、弱缺陷或其它弱特征信號的檢測和估計中[5] [6]。
當語音信號含有噪聲干擾時,可以利用隨機共振原理進行分析語音信號,進行語音增強的研究。本文基于多閾值非周期隨機共振原理,提出一種通過自適應調節,添加最佳噪聲的方法,使語音信號在閾值最優隨機共振,從而到達含噪語音信號增強。
2非周期隨機共振
隨機共振的研究一般限于弱信號(閾下信號),在一定程度上有效地解決弱故障、弱缺陷或其它弱特征信號的檢測問題,因為在弱信號的監測中,閾上信號一般是被認為噪聲的存在是不利于系統對輸入信號的響應。而在Stocks提出的閾上隨機共振[7],先前對H-H(Hodgkin-Huxley)神經元模型非周期信號響應研究表明H-H神經元模型,存在閾下非周期隨機共振現象,但引入噪聲可以增強神經元對非周期輸入信號的響應,而且在一個合適的噪聲強度上,神經元輸出互信息率達到了最大值,這時就產生了閾上非周期隨機共振現象。
由于H-H神經元模型本質上是二階模型,經對H-H神經元模型的二階簡化模型閾值特性的相平面分析,表明該二階簡化模型等價于閾值單元模型,其閾值跨越可以選定多閾值。而語音信號處于[-1, 1]區間內,信號更多是以非周期信號的形式出現。由此本文提出,利用H-H神經元模型閾上非周期隨機共振的原理,提出多閾值閾上隨機共振,來實現對強噪聲語音增強。
3基于非周期隨機共振語音增強算法基本原理及算法步驟
3.1評價方法
驗證本文所提自適應隨機共振語音增強算法的有效性,分別求得增強前后語音的信噪比(SNR)并對增強前后的語音進行聽覺實驗。評價指標(SNR)的定義如下:
式(4)中,μ為噪聲強度改變的步長,sgn為符號函數,SNR為含噪語音信號信噪比,σ為噪聲強度。
3.3算法步驟
根據基本思想闡述,本文進一步的應用于單聲道的語音增強系統中。
1)分析輸入含噪語音信號s(n),設置最佳噪聲迭代步數H、每一步需要加噪次數Z及噪聲強度改變的步長μ;
2)添加相互獨立且噪聲強度相等δ的高斯白噪聲Z次到輸入含噪語音信號s(n);
3)將每次添加白噪聲得到語音信號Sij(n)根據式(2)進行閾值分類,根據式(3)將每次輸出的yt(n)得到yf(n);
4)如果當前的迭代步數f=H,則輸出語音信號為最優的語音增強信號yf(n),反之,轉向步驟(2),根據式(4)改變噪聲強度。
3.4多閾值非周期隨機共振算法初值選取及算法原理圖
由于添加噪聲次數Z同算法隨機共振效果緊密聯系,Z取值越大,算法隨機共振效果越明顯,復原的效果也更好。但Z的增大同樣也會導致算法執行效率的降低,兼顧兩者,而且經過實驗測試,本文取Z =150。最佳噪聲迭代步數H決定了迭代的收斂特性,H取值越大,算法迭代的結果就越趨近于某一收斂值;但同時隨著H取值增大,算法執行所需要時間也就越長,因而在實際仿真應用中要兼顧兩者考慮,本文取H =300。經仿真實驗,取步長μ=0.2為定值。
4仿真結果與分析
實驗中采用的語音材料在實際道路環境中采集的道路噪聲,用于隨機共振處理的噪聲選自NOISE-92數據庫,噪聲類型為白噪聲。語音信號和噪聲信號均8Hz采樣, 16bit量化。根據本文提出的語音增強算法,采用語音庫中的多種純凈語音樣本進行反復試驗,不同的信噪比合成各種實驗所需的含噪語音信號。
圖2表示利用本文提出的多閾值隨機共振方法進行語音增強,以及于傳統的減譜法進行語音增強效果比較。不同的噪聲強度下,采用本文提出的語音增強算法和傳統的減普法仿真結果如表1所示。且進行兩種算法結果的線性比較如圖3所示。
從圖2(b)可以看出,在強噪聲環境中將噪聲作為是能夠實現對語音信號增強,但是仍然有噪聲殘留,同時比較傳統減譜法的語音增強(圖2(c)),明顯可以看出本文提出的方法處理效果優于傳統減譜法,因而本文提出的算法能夠很好增強在強噪聲環境中語音信號。
通過對反復實驗的數據進行分析,由表1和圖3可見,在噪聲較弱的情況下,相對于傳統減譜法,本文方法沒有顯示出優越性,復原的效果甚至比傳統方法差;但是隨著噪聲逐漸增強,相對于強背景噪聲,本文方法明顯優于傳統算法,且隨著噪聲強度的增加,語音增強效果越好。針對傳統的語音增強方法,削弱噪聲來間接地增強有用信號,而處于最優隨機共振狀態的語音閾值系統是將噪聲能量轉化為有用信號的能量以此來增強輸出信號,由此噪聲的強弱對于本文方法抑噪能力的影響相對小。
5結論
本文基于閾上非周期隨機共振原理,提出一種通過自適應調節添加最佳噪聲的方法,達到語音信號閾上最優隨機共振,從而實現語音增強。與傳統的算法區別在于:利用了噪聲來實現語音增強,而不是去除噪聲。從而產生語音閾上非周期隨機共振現象,并且對噪聲的變化具有魯棒性,提出了語音增強的新方法。
摘自:中國計量測控網