日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

一種用于對說話人識別的前端語音增強方法

文檔序號:9668711閱讀:979來源:國知局
一種用于對說話人識別的前端語音增強方法
【技術(shù)領(lǐng)域】
[0002] 本發(fā)明涉及語音信號處理領(lǐng)域,特別指一種用于對說話人識別的前端語音增強方 法。
【背景技術(shù)】
[0003] 說話人識別是一種通過特定人說話的語音對其身份進行識別的技術(shù)。但由于實際 環(huán)境中存在各種各樣的噪聲,說話人識別系統(tǒng)的性能會顯著降低。在前端加入合適的語音 增強模塊可以有效地提高整體系統(tǒng)的識別率,以提高系統(tǒng)對噪聲的魯棒性。然而實際情況 下,語音增強算法無法完全恢復(fù)純凈的語音信號,而且由于算法本身的缺陷會帶來殘留噪 聲和語音失真。對于說話人識別技術(shù)來說,它利用語音中蘊含的說話人特征信息對說話人 的身份進行識別,因而對語音失真十分敏感,所以針對說話人識別系統(tǒng)的前段語音增強方 法不同于常規(guī)的語音增強方法,需要進行相應(yīng)的調(diào)整,以達到最佳的系統(tǒng)識別效果。
[0004]單通道語音增強是一種對帶噪語音信號進行分析處理,估計得到純凈語音信號的 處理技術(shù)。實際環(huán)境中的噪聲信號通常是高度非平穩(wěn)信號,其噪聲能量在頻譜上分布極不 均勻,且隨時間快速變化,在此情況下對噪聲的估計和相應(yīng)的語音信號恢復(fù)都是十分困難 的。常規(guī)的語音增強方法有譜減法、維納濾波法、信號子空間分離方法和統(tǒng)計模型方法等, 它們各有優(yōu)勢與不足之處,往往會根據(jù)實際應(yīng)用場景做相應(yīng)的選擇或融合。譜減法是一種 實現(xiàn)簡單快速但效果顯著的語音增強算法,以其為基礎(chǔ)的各種改進方法目前也在語音處理 系統(tǒng)中被廣泛使用。

【發(fā)明內(nèi)容】

[0005]本發(fā)明所要解決的技術(shù)問題是針對上述現(xiàn)有技術(shù)的不足,提供一種基于聽覺掩蔽 閾值和參數(shù)自適應(yīng)的改進譜減法,通過掩蔽閾值來保證語音失真度最小化,從而既能提高 說話人識別系統(tǒng)的抗噪聲性能,又盡可能地達到對語音特征損傷最小的用于對說話人識別 的前端語音增強方法。
[0006]本發(fā)明解決該技術(shù)問題所采用的技術(shù)方案如下:一種用于對說話人識別的前端語 音增強方法,包括以下步驟: 第一步,對輸入語音信號進行分幀、加窗,對每一幀用FFT計算短時功率譜|7(州|2和相 位譜吵; 第二步,利用語音幀的短時功率譜進行估計,采用改進最小控制遞歸平均算法估計噪 聲的功率譜 該估計算法通過兩次平滑,兩次最小值搜索和計算語音存在概率得出最終的噪聲功率 譜結(jié)果,功率譜平滑公式和最小值搜索方法如下所示:

而語音存在概率通過第一次平滑的結(jié)果和先驗后驗信噪比得出,公式如下:
上述公式中U分別為頻帶序號和幀序號,《丨):=多(與! %⑴為語音不存在的概率, 分別為先驗和后驗信噪比,而KU)會i); 最后根據(jù)語音存在的概率p(私0估計噪聲功率譜·^:
第三步,用估計得到的噪聲功率譜做初步降噪,采用的降噪方法為多頻帶譜減法,得到 初步的增強語音功率譜,多頻帶譜減法的公式如下所示:
其中過減因子%和控制因子仏隨子頻帶信噪比和頻率進行自適應(yīng)調(diào)整; 第四步,利用初步增強語音功率譜計算聽覺掩蔽閾值,具體是計算Bark子帶的功率譜 茗(0,后用擴散函數(shù)%(〇進行擴散后得到擴散功率譜:
之后再利用譜平坦度判決子帶的語音存在概率以此調(diào)整得到掩蔽閾值:
最后與絕對聽域比較得祝丨m故的愉祐丨?估-
第五步,利用聽覺掩蔽閾值調(diào)整過減因子和譜減系數(shù),進行第二次譜減法,最后用IFFT得到最終的增強信號,過減因子和譜減系數(shù)的調(diào)整公式如下:
而采用自適應(yīng)參數(shù)調(diào)整的譜減法公式如下所示:
[0007]優(yōu)選地,所述的最大過減因子具體為= =4;且為掩蔽閾值設(shè)置了浮動范 圍&& =5, =1 〇〇,以防止參數(shù)變化過大,使得語音特征能最大程度地保留。
[0008] 優(yōu)選地,上述步驟中所采用的硬件設(shè)備為PC機。
[0009] 優(yōu)選地,上述的用于說話人識別系統(tǒng)的前端語音增強方法,經(jīng)過實驗檢驗,在信噪 比輸出和說話人識別系統(tǒng)的性能提升方面,均比常規(guī)譜減法有很大改善。
[0010] 本發(fā)明的有益效果在于: 本發(fā)明與常規(guī)的譜減法相比,在說話人識別系統(tǒng)前端處理上具有實質(zhì)性特點和顯著進 步,具體體現(xiàn)如下: (1)本發(fā)明以傳統(tǒng)譜減法為基礎(chǔ),提出了結(jié)合最小控制遞歸平均噪聲估計過程及計算 聽覺掩蔽閾值的改進型二次譜減法,能自適應(yīng)調(diào)整譜減法中涉及的各項參數(shù),以保證語音 增強后的語音失真最小化,從而使處理后的語音信號在說話人識別系統(tǒng)中有良好的表現(xiàn)。
[0011] (2)通過多頻帶譜減法的初步處理,得到初步的語音增強結(jié)果以計算聽覺掩蔽閾 值,相比直接在帶噪語音中計算掩蔽閾值更為準(zhǔn)確,從而保證第二次的參數(shù)調(diào)整能更好地 體現(xiàn)純凈語音的掩蔽特性,從而在噪聲頻段降低殘留噪聲,在語音頻段保持語音特征。
【附圖說明】
[0012] 圖1為前端語音增強算法的流程圖。
[0013] 圖2為Bark臨界帶寬對應(yīng)FFT頻點表。
[0014] 圖3(a)為純凈語音的時域波形圖。
[0015] 圖3(b)為帶噪語音的時域波形圖。
[0016] 圖3(c)為采用常規(guī)譜減法語音增強后的時域波形圖。
[0017] 圖3(d)為采用多頻帶譜減法語音增強后的時域波形圖。
[0018] 圖3(e)為采用本發(fā)明語音增強方法后的時域波形圖。
[0019] 圖4(a)為white噪聲下SNR輸入輸出曲線圖。
[0020]圖4(b)為white噪聲下SNR輸入輸出曲線圖。
[0021 ]圖4(c)為white噪聲下SNR輸入輸出曲線圖。
【具體實施方式】
[0022]下面將結(jié)合附圖對本發(fā)明作進一步描述: 如圖1所示,本發(fā)明采取的技術(shù)方案如下:一種用于對說話人識別的前端語音增強方 法,包括以下步驟: 第一步,對輸入語音信號進行分幀、加窗,對每一幀用FFT計算短時功率譜和相 位譜巧(的; 第二步,利用語音幀的短時功率譜進行估計,采用改進最小控制遞歸平均算法估計噪 聲的功率譜 該估計算法通過兩次平滑,兩次最小值搜索和計算語音存在概率得出最終的噪聲功率 譜結(jié)果,功率譜平滑公式和晶,丨、佶埔宏玄法加下所元.
而語音存在概率通過第一次平滑的結(jié)果和先驗后驗信噪比得出,公式如下:
上述公式中,以分別為頻帶序號和幀序號為語音不存在的概率, 分別為先驗和后驗信噪比,而 <以)備域7,(1 +i); 最后根據(jù)語音存在的概率於:以)估計噪聲功率譜:4:
第三步,用估計得到的噪聲功率譜做初步降噪,采用的降噪方法為多頻帶譜減法,得到 初步的增強語音功率譜,多頻帶譜減法的公式如下所示:
其中過減因子巧和控制因子仏隨子頻帶信噪比和頻率進行自適應(yīng)調(diào)整; 第四步,利用初步增強語音功率譜計算聽覺掩蔽閾值,具體是計算Bark子帶的功率譜 瑪(0,后用擴散函數(shù)%的進行擴散后得到擴散功率譜:
之后再利用譜平坦度判決子帶的語音存在概率〇,以此調(diào)整得到掩蔽閾值:
最后與絕對聽域比較得剎昜線的插:蔽闌佶.
第五步,利用聽覺掩蔽閾值調(diào)整過減因子和譜減系數(shù),進行第二次譜減法,最后用IFFT得到最終的增強信號,過減因子和譜減系數(shù)的調(diào)整公式如下:
而采用自適應(yīng)參數(shù)調(diào)整的譜減法公式如下所示:
[0023]最大過減因子具體為CW= =4 ;且為掩蔽閾值設(shè)置了浮動范圍 以防止參數(shù)變化過大,使得語音特征能最大程度地保留。
[0024]具體地,實際環(huán)境中,帶噪語音信號通常是由純凈語音信號與干擾信號的疊加得 到:
其中j(i)為帶噪信號,s(i)為純凈話苜彳目虧,μ栄聲信號,?為時間序列,在數(shù)字信號 處理中通常為離散表示。
[0025]語音增強的目的就是從帶噪信號^Κ?)中通過噪聲估計和語音恢復(fù)算法得到純凈語 音信號乾0的過程,研究表示,語音信號可近似看作短時平穩(wěn)信號,因而一般的語音增強方 法是對短時語音幀的頻城由對佶馬講桿々卜理.
通常僅對幅度譜^ (的I或功率譜|y〇)f進行處理,而相位譜%細(xì))不做變化。
[0026]下面按模塊順序?qū)Υ朔椒ㄟM行解釋: (1)噪聲估計 對于單通道語音增強方法,噪聲信息無法直接得到,只能從帶噪語音中進行估計得到。 而噪聲估計的結(jié)果對語音增強效果有十分重要的影響,噪聲估計過高,則會破壞純凈語音 信號,而噪聲估計過低,則會有更大的殘留噪聲或音樂噪聲。因而采取合適的噪聲估計算法 在前端語音處理中是非常必要的。
[0027]傳統(tǒng)噪聲估計方法是利用語音活動檢測(VAD)檢測出非語音幀,將其視作噪聲進 行平滑后
當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1