日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

用于遠場語音識別的預(yù)處理方法和裝置的制造方法

文檔序號:9598811閱讀:777來源:國知局
用于遠場語音識別的預(yù)處理方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及語音識別技術(shù)領(lǐng)域,尤其涉及一種用于遠場語音識別的預(yù)處理方法和 裝置。
【背景技術(shù)】
[0002] 為了提高語音識別的準確度,在語音識別之前通常會進行預(yù)處理。在遠場語音識 別場景下,目前采用比較多的一種預(yù)處理方案是回聲消除(Acoustic echo cancellation, AEC) +聲源定位+自適應(yīng)波束形成技術(shù)。大致的思想是:先對每個麥克風(fēng)采集的語音信號 進行回聲消除、再基于聲源定位技術(shù)找到目標(biāo)說話人的空間方位,進而通過自適應(yīng)波束形 成(Adaptive Beamforming,ABF)技術(shù)將主波束指向說話人,實現(xiàn)聲音增強的效果。
[0003] 但是,上述處理方案在運算量、準確度、收斂速度和殘差等方面都存在一定的問 題,進而影響最終的遠場語音識別性能。

【發(fā)明內(nèi)容】

[0004] 本發(fā)明旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。
[0005] 為此,本發(fā)明的一個目的在于提出一種用于遠場語音識別的預(yù)處理方法,該方法 可以實現(xiàn)了信號的聲源定位和語音增強功能,并且新的波束形成方法還保證了陣列的空間 響應(yīng)與頻率無關(guān),從而降低信號的頻譜失真程度,保證了后續(xù)音頻通訊,尤其是語音識別系 統(tǒng)的性能。
[0006] 本發(fā)明的另一個目的在于提出一種用于遠場語音識別的預(yù)處理裝置。
[0007] 為達到上述目的,本發(fā)明第一方面實施例提出的用于遠場語音識別的預(yù)處理方 法,包括:獲取由麥克風(fēng)陣列采集的多路語音信號;根據(jù)預(yù)設(shè)的頻率點閾值,將所述多路語 音信號分為低頻分量和中高頻分量;對低頻分量進行延遲求和波束形成,以及,對中高頻分 量進行基于濾波器的波束形成。
[0008] 本發(fā)明第一方面實施例提出的用于遠場語音識別的預(yù)處理方法,通過上述是波束 形成方法,同時實現(xiàn)了信號的聲源定位和語音增強功能,并且上述的波束形成方法還保證 了陣列的空間響應(yīng)與頻率無關(guān),從而降低信號的頻譜失真程度,保證了后續(xù)音頻通訊,尤其 是語音識別系統(tǒng)的性能。
[0009] 為達到上述目的,本發(fā)明第二方面實施例提出的用于遠場語音識別的預(yù)處理裝 置,包括:獲取模塊,用于獲取由麥克風(fēng)陣列采集的多路語音信號;劃分模塊,用于根據(jù)預(yù) 設(shè)的頻率點閾值,將所述多路語音信號分為低頻分量和中高頻分量;波束形成模塊,用于對 低頻分量進行延遲求和波束形成,以及,對中高頻分量進行基于濾波器的波束形成。
[0010] 本發(fā)明第二方面實施例提出的用于遠場語音識別的預(yù)處理裝置,通過上述是波束 形成方法,同時實現(xiàn)了信號的聲源定位和語音增強功能,并且上述的波束形成方法還保證 了陣列的空間響應(yīng)與頻率無關(guān),從而降低信號的頻譜失真程度,保證了后續(xù)音頻通訊,尤其 是語音識別系統(tǒng)的性能。
[0011] 本發(fā)明附加的方面和優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變 得明顯,或通過本發(fā)明的實踐了解到。
【附圖說明】
[0012] 本發(fā)明上述的和/或附加的方面和優(yōu)點從下面結(jié)合附圖對實施例的描述中將變 得明顯和容易理解,其中:
[0013] 圖1是本發(fā)明一實施例提出的用于遠場語音識別的預(yù)處理方法的流程示意圖;
[0014] 圖2是本發(fā)明另一實施例提出的用于遠場語音識別的預(yù)處理方法的流程示意圖;
[0015] 圖3是本發(fā)明另一實施例提出的用于遠場語音識別的預(yù)處理裝置的結(jié)構(gòu)示意圖;
[0016] 圖4是本發(fā)明另一實施例提出的用于遠場語音識別的預(yù)處理裝置的結(jié)構(gòu)示意圖。
【具體實施方式】
[0017] 下面詳細描述本發(fā)明的實施例,所述實施例的示例在附圖中示出,其中自始至終 相同或類似的標(biāo)號表示相同或類似的模塊或具有相同或類似功能的模塊。下面通過參考 附圖描述的實施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。相反, 本發(fā)明的實施例包括落入所附加權(quán)利要求書的精神和內(nèi)涵范圍內(nèi)的所有變化、修改和等同 物。
[0018] 圖1是本發(fā)明一實施例提出的用于遠場語音識別的預(yù)處理方法的流程示意圖,該 方法包括:
[0019] S11 :獲取由麥克風(fēng)陣列采集的多路語音信號。
[0020] 其中,麥克風(fēng)陣列可以具體是均勾環(huán)形麥克風(fēng)陣列(Uniform Circular Array, UCA),UCA是指將多個麥克風(fēng)均勻設(shè)置在環(huán)形平面上。
[0021] 通過每個麥克風(fēng)采集一路語音信號,從而可以獲取到多路語音信號。
[0022] 麥克風(fēng)的個數(shù)以及環(huán)形半徑可以設(shè)置,例如,N = 16, R = 0. 08m。
[0023] S12:根據(jù)預(yù)設(shè)的頻率點閾值,將所述多路語音信號分為低頻分量和中高頻分量。
[0024] 頻率點閾值例如是f0 = 1 kHz。
[0025] 低頻分量是指頻率小于fO的部分,中高頻分量是指頻率大于fO的部分。
[0026] 每一路語音信號的頻譜范圍通常是在0-8kHz,通過與頻率點閾值比較,可以將采 集的多路語音信號分為低頻分量和中高頻分量。
[0027] S13 :對低頻分量進行延遲求和波束形成,以及,對中高頻分量進行基于濾波器的 波束形成。
[0028] 對均勻環(huán)形麥克風(fēng)陣列采集的語音信號進行延時求和波束形成可以稱為DS-UCA, 對均勻環(huán)形麥克風(fēng)陣列采集的語音信號進行基于濾波器的波束形成可以稱為FIB-UCA。
[0029] 一些實施例中,參見圖2,對低頻分量的處理流程可以包括:
[0030] S201 :對低頻分量根據(jù)空間響應(yīng)的公式,進行DS-UCA的波束成形。
[0031] 其中,DS-UCA的波束成形時采用的空間響應(yīng)的公式是:
[0033] 其中,N是均勻環(huán)形麥克風(fēng)陣列中麥克風(fēng)的個數(shù),R是環(huán)形半徑,B表示波束形成器 的空間響應(yīng),ω是語音信號的角頻率,θ,φ分別是語音信號的仰角和方向角,在遠場識別 場景下,Θ = 9。= Ji/2,k是波數(shù),k= c〇/c,c是光速,Θ。,φ。分別是主波束的仰角和方 向角,γη是第η個麥克風(fēng)的方向角,γ n= 2 π (n-l)/N。主波束的仰角和方向角可以設(shè)置。
[0034] S202 :對低頻分量中的高頻分量進行預(yù)加重處理。
[0035] 通過公式(1)可以看出,當(dāng)語音信號的頻率越大,頻譜失真越嚴重,為此,在對低 頻分量(Ο-lkHz)計算空間響應(yīng)后,可以對低頻分量中的高頻分量(偏向1kHz的部分)進 行預(yù)加重處理。預(yù)加重處理時例如在上述的空間響應(yīng)B的基礎(chǔ)上乘以一個增益因子,該增 益因子與頻率成正比。具體的低頻分量中高頻分量的選擇以及增益因子的設(shè)置可以根據(jù)經(jīng) 驗值確定。
[0036] 一些實施例中,參見圖2,對中高頻分量的處理流程可以包括:
[0037] S203 :確定補償濾波器。
[0038] 補償濾波器Η" (ω)的公式是:
[0040] 其中,〇^分別表示ω的最低和最高值,Κ是麥克風(fēng)的個數(shù),m是相位模式 (phase-mode)的索弓丨,其中,麥克風(fēng)采集的語音信號經(jīng)過離散傅里葉逆變換(Inverse Discrete Fourier Transform,IDFT)變換可以轉(zhuǎn)換為相位模式,Jn ( α )為第一類 Bessel 函數(shù),
r是麥克風(fēng)陣列的半徑,c是光速,f是語音信 號的頻率,是最高頻率。
[0041] S204:確定加權(quán)因子。
[0042] 加權(quán)因子{gm}是一個Μ階有限長單位沖激響應(yīng)(Finite Impulse Response,F(xiàn)IR) 濾波器系數(shù),M是m的最大
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1