用于遠場語音識別的預(yù)處理方法和裝置的制造方法

文檔序號：9598811閱讀：777來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

用于遠場語音識別的預(yù)處理方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及語音識別技術(shù)領(lǐng)域，尤其涉及一種用于遠場語音識別的預(yù)處理方法和裝置。
【背景技術(shù)】
[0002] 為了提高語音識別的準確度，在語音識別之前通常會進行預(yù)處理。在遠場語音識別場景下，目前采用比較多的一種預(yù)處理方案是回聲消除（Acoustic echo cancellation， AEC) +聲源定位+自適應(yīng)波束形成技術(shù)。大致的思想是：先對每個麥克風(fēng)采集的語音信號進行回聲消除、再基于聲源定位技術(shù)找到目標(biāo)說話人的空間方位，進而通過自適應(yīng)波束形成（Adaptive Beamforming，ABF)技術(shù)將主波束指向說話人，實現(xiàn)聲音增強的效果。
[0003] 但是，上述處理方案在運算量、準確度、收斂速度和殘差等方面都存在一定的問題，進而影響最終的遠場語音識別性能。

【發(fā)明內(nèi)容】

[0004] 本發(fā)明旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。
[0005] 為此，本發(fā)明的一個目的在于提出一種用于遠場語音識別的預(yù)處理方法，該方法可以實現(xiàn)了信號的聲源定位和語音增強功能，并且新的波束形成方法還保證了陣列的空間響應(yīng)與頻率無關(guān)，從而降低信號的頻譜失真程度，保證了后續(xù)音頻通訊，尤其是語音識別系統(tǒng)的性能。
[0006] 本發(fā)明的另一個目的在于提出一種用于遠場語音識別的預(yù)處理裝置。
[0007] 為達到上述目的，本發(fā)明第一方面實施例提出的用于遠場語音識別的預(yù)處理方法，包括：獲取由麥克風(fēng)陣列采集的多路語音信號；根據(jù)預(yù)設(shè)的頻率點閾值，將所述多路語音信號分為低頻分量和中高頻分量；對低頻分量進行延遲求和波束形成，以及，對中高頻分量進行基于濾波器的波束形成。
[0008] 本發(fā)明第一方面實施例提出的用于遠場語音識別的預(yù)處理方法，通過上述是波束形成方法，同時實現(xiàn)了信號的聲源定位和語音增強功能，并且上述的波束形成方法還保證了陣列的空間響應(yīng)與頻率無關(guān)，從而降低信號的頻譜失真程度，保證了后續(xù)音頻通訊，尤其是語音識別系統(tǒng)的性能。
[0009] 為達到上述目的，本發(fā)明第二方面實施例提出的用于遠場語音識別的預(yù)處理裝置，包括：獲取模塊，用于獲取由麥克風(fēng)陣列采集的多路語音信號；劃分模塊，用于根據(jù)預(yù) 設(shè)的頻率點閾值，將所述多路語音信號分為低頻分量和中高頻分量；波束形成模塊，用于對低頻分量進行延遲求和波束形成，以及，對中高頻分量進行基于濾波器的波束形成。
[0010] 本發(fā)明第二方面實施例提出的用于遠場語音識別的預(yù)處理裝置，通過上述是波束形成方法，同時實現(xiàn)了信號的聲源定位和語音增強功能，并且上述的波束形成方法還保證了陣列的空間響應(yīng)與頻率無關(guān)，從而降低信號的頻譜失真程度，保證了后續(xù)音頻通訊，尤其是語音識別系統(tǒng)的性能。
[0011] 本發(fā)明附加的方面和優(yōu)點將在下面的描述中部分給出，部分將從下面的描述中變得明顯，或通過本發(fā)明的實踐了解到。
【附圖說明】
[0012] 本發(fā)明上述的和/或附加的方面和優(yōu)點從下面結(jié)合附圖對實施例的描述中將變得明顯和容易理解，其中：
[0013] 圖1是本發(fā)明一實施例提出的用于遠場語音識別的預(yù)處理方法的流程示意圖；
[0014] 圖2是本發(fā)明另一實施例提出的用于遠場語音識別的預(yù)處理方法的流程示意圖；
[0015] 圖3是本發(fā)明另一實施例提出的用于遠場語音識別的預(yù)處理裝置的結(jié)構(gòu)示意圖；
[0016] 圖4是本發(fā)明另一實施例提出的用于遠場語音識別的預(yù)處理裝置的結(jié)構(gòu)示意圖。
【具體實施方式】
[0017] 下面詳細描述本發(fā)明的實施例，所述實施例的示例在附圖中示出，其中自始至終相同或類似的標(biāo)號表示相同或類似的模塊或具有相同或類似功能的模塊。下面通過參考附圖描述的實施例是示例性的，僅用于解釋本發(fā)明，而不能理解為對本發(fā)明的限制。相反，本發(fā)明的實施例包括落入所附加權(quán)利要求書的精神和內(nèi)涵范圍內(nèi)的所有變化、修改和等同物。
[0018] 圖1是本發(fā)明一實施例提出的用于遠場語音識別的預(yù)處理方法的流程示意圖，該方法包括：
[0019] S11 :獲取由麥克風(fēng)陣列采集的多路語音信號。
[0020] 其中，麥克風(fēng)陣列可以具體是均勾環(huán)形麥克風(fēng)陣列（Uniform Circular Array， UCA)，UCA是指將多個麥克風(fēng)均勻設(shè)置在環(huán)形平面上。
[0021] 通過每個麥克風(fēng)采集一路語音信號，從而可以獲取到多路語音信號。
[0022] 麥克風(fēng)的個數(shù)以及環(huán)形半徑可以設(shè)置，例如，N = 16, R = 0. 08m。
[0023] S12:根據(jù)預(yù)設(shè)的頻率點閾值，將所述多路語音信號分為低頻分量和中高頻分量。
[0024] 頻率點閾值例如是f0 = 1 kHz。
[0025] 低頻分量是指頻率小于fO的部分，中高頻分量是指頻率大于fO的部分。
[0026] 每一路語音信號的頻譜范圍通常是在0-8kHz，通過與頻率點閾值比較，可以將采集的多路語音信號分為低頻分量和中高頻分量。
[0027] S13 :對低頻分量進行延遲求和波束形成，以及，對中高頻分量進行基于濾波器的波束形成。
[0028] 對均勻環(huán)形麥克風(fēng)陣列采集的語音信號進行延時求和波束形成可以稱為DS-UCA，對均勻環(huán)形麥克風(fēng)陣列采集的語音信號進行基于濾波器的波束形成可以稱為FIB-UCA。
[0029] 一些實施例中，參見圖2,對低頻分量的處理流程可以包括：
[0030] S201 :對低頻分量根據(jù)空間響應(yīng)的公式，進行DS-UCA的波束成形。
[0031] 其中，DS-UCA的波束成形時采用的空間響應(yīng)的公式是：
[0033] 其中，N是均勻環(huán)形麥克風(fēng)陣列中麥克風(fēng)的個數(shù)，R是環(huán)形半徑，B表示波束形成器的空間響應(yīng)，ω是語音信號的角頻率，θ，φ分別是語音信號的仰角和方向角，在遠場識別場景下，Θ = 9。= Ji/2，k是波數(shù)，k= c〇/c，c是光速，Θ。，φ。分別是主波束的仰角和方向角，γη是第η個麥克風(fēng)的方向角，γ n= 2 π (n-l)/N。主波束的仰角和方向角可以設(shè)置。
[0034] S202 :對低頻分量中的高頻分量進行預(yù)加重處理。
[0035] 通過公式（1)可以看出，當(dāng)語音信號的頻率越大，頻譜失真越嚴重，為此，在對低頻分量（Ο-lkHz)計算空間響應(yīng)后，可以對低頻分量中的高頻分量（偏向1kHz的部分）進行預(yù)加重處理。預(yù)加重處理時例如在上述的空間響應(yīng)B的基礎(chǔ)上乘以一個增益因子，該增益因子與頻率成正比。具體的低頻分量中高頻分量的選擇以及增益因子的設(shè)置可以根據(jù)經(jīng) 驗值確定。
[0036] 一些實施例中，參見圖2,對中高頻分量的處理流程可以包括：
[0037] S203 :確定補償濾波器。
[0038] 補償濾波器Η" (ω)的公式是：
[0040] 其中，〇^分別表示ω的最低和最高值，Κ是麥克風(fēng)的個數(shù)，m是相位模式 (phase-mode)的索弓丨，其中，麥克風(fēng)采集的語音信號經(jīng)過離散傅里葉逆變換（Inverse Discrete Fourier Transform，IDFT)變換可以轉(zhuǎn)換為相位模式，Jn ( α )為第一類 Bessel 函數(shù)，
r是麥克風(fēng)陣列的半徑，c是光速，f是語音信號的頻率，是最高頻率。
[0041] S204:確定加權(quán)因子。
[0042] 加權(quán)因子{gm}是一個Μ階有限長單位沖激響應(yīng)（Finite Impulse Response，F(xiàn)IR) 濾波器系數(shù)，M是m的最大

完整全部詳細技術(shù)資料下載

當(dāng)前第1頁1 2 3

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：宋輝;魏建強;
技術(shù)所有人：百度在線網(wǎng)絡(luò)技術(shù)（北京）有限公司;
我是此專利的發(fā)明人

上一篇：一種單端mic共模噪聲的降噪方法
上一篇：編碼方案確定的方法和設(shè)備的制造方法

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

遠場語音識別相關(guān)技術(shù)

語音識別預(yù)處理相關(guān)技術(shù)

hmm用于語音識別相關(guān)技術(shù)

無限極預(yù)處理裝置相關(guān)技術(shù)

原料預(yù)處理裝置相關(guān)技術(shù)

日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

用于遠場語音識別的預(yù)處理方法和裝置的制造方法