信號(hào)處理的方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及信號(hào)處理領(lǐng)域,尤其涉及一種信號(hào)處理的方法及裝置。
【背景技術(shù)】
[0002] 基于麥克風(fēng)陣列的語(yǔ)音增強(qiáng)方法中應(yīng)用最普遍的是利用陣列的波束形成特性。根 據(jù)實(shí)現(xiàn)方式不同,現(xiàn)有的波束形成技術(shù)可以分為固定波束形成技術(shù)(Delay and Sum Beam forming, DSBF)和自適應(yīng)波束形成技術(shù)。Flanagan在1985年提出DSBF方法是一種最簡(jiǎn) 單的固定波束形成方法。它首先將陣列中各個(gè)麥克風(fēng)上接收到的語(yǔ)音信號(hào)進(jìn)行時(shí)間補(bǔ)償, 以使各通道的語(yǔ)音同步,然后對(duì)各通道信號(hào)相加平均。在這種情況下,一旦信號(hào)偏離陣列指 向,陣列對(duì)于不同頻率的信號(hào)會(huì)表現(xiàn)出不同的增益,從而造成寬帶信號(hào)的處理失真。
[0003] 與固定波束形成技術(shù)相對(duì)應(yīng)的另一類波束形成技術(shù)就是自適應(yīng)的波束形成,其自 適應(yīng)特性表現(xiàn)在濾波系數(shù)是隨著輸入信號(hào)統(tǒng)計(jì)特性的變化而變化的。Griffth和Jim于 1982提出的廣義旁瓣抵消器(Generalized Sidelobe Canceller, GSC)是自適應(yīng)波束形成 器的一種通用模型。然而GSC算法中,阻塞矩陣(Block Matrix,BM)的輸出往往含有有效 的語(yǔ)音成分,這樣在濾波結(jié)果中會(huì)對(duì)原始語(yǔ)音造成損傷。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明提供一種處理信號(hào)的方法及裝置,主要目的在于解決現(xiàn)有技術(shù)中存在的基 于麥克風(fēng)陣列的語(yǔ)音增強(qiáng)時(shí)寬帶信號(hào)的失真問(wèn)題。
[0005] 為實(shí)現(xiàn)上述目的,本發(fā)明提供的一種信號(hào)處理的方法,所述方法包括:
[0006] 獲取至少兩個(gè)通道聲音信號(hào),并對(duì)各個(gè)通道聲音信號(hào)進(jìn)行短時(shí)傅里葉變換STFT, 獲取所述各個(gè)通道聲音信號(hào)對(duì)應(yīng)的頻域音頻信號(hào);
[0007] 根據(jù)預(yù)先設(shè)置的多方向的權(quán)向量和所述各個(gè)通道聲音信號(hào)對(duì)應(yīng)的頻域音頻信號(hào) 獲取每個(gè)頻點(diǎn)的音頻信號(hào)對(duì)應(yīng)波束群的波束形成輸出信號(hào);
[0008] 根據(jù)同一方向的不同頻點(diǎn)的波束能量獲取所述波束群的輸出方向;
[0009] 獲取所述方向上波束形成后輸出的時(shí)域聲音信號(hào)。
[0010] 優(yōu)選地,所述根據(jù)預(yù)先設(shè)置的多方向的權(quán)向量和所述各個(gè)通道聲音信號(hào)對(duì)應(yīng)的頻 域音頻信號(hào)獲取每個(gè)頻點(diǎn)的音頻信號(hào)對(duì)應(yīng)波束群的波束形成輸出信號(hào),包括:
[0011] 根據(jù)預(yù)先設(shè)置的多方向的權(quán)向量,選取全部或部分通道聲音信號(hào)對(duì)應(yīng)的頻域音頻 信號(hào),獲取每個(gè)頻點(diǎn)的音頻信號(hào)對(duì)應(yīng)波束群的波束形成輸出信號(hào)
[0012] 優(yōu)選地,所述根據(jù)同一方向的不同頻點(diǎn)的波束能量獲取所述波束群的輸出方向, 包括:
[0013] 對(duì)同一方向的不同頻點(diǎn)的波束能量進(jìn)行求和,并選取波束能量最大的方向作為輸 出方向。
[0014] 優(yōu)選地,所述對(duì)同一方向的不同頻點(diǎn)的波束能量進(jìn)行求和,并選取波束能量最大 的方向作為輸出方向,包括:
[0015] 對(duì)同一方向的預(yù)先設(shè)置的第一頻率至第二頻率之間的所有頻點(diǎn)的波束能量進(jìn)行 求和,并選取波束能量最大的方向作為輸出方向。
[0016] 優(yōu)選地,所述多方向的權(quán)向量是基于延時(shí)累加波束形成算法、線性約束最小方差 波束形成算法、廣義旁瓣抵消波束形成算法或者最小方差無(wú)畸變響應(yīng)法MVDR得到的。
[0017] 優(yōu)選地,所述根據(jù)同一方向的不同頻點(diǎn)的波束能量獲取所述波束群的輸出方向之 后,還包括:
[0018] 對(duì)所述輸出方向上波束形成后輸出的各頻點(diǎn)的音頻信號(hào)乘以增益,所述增益為與 頻域值正比例相關(guān)的值。
[0019] 優(yōu)選地,所述增益在預(yù)先設(shè)置的不同頻域值范圍內(nèi),與頻域值有不同的正比例關(guān) 系。
[0020] 此外,為實(shí)現(xiàn)上述目的,本發(fā)明還提供一種信號(hào)處理的裝置,所述裝置包括:
[0021] 短時(shí)傅里葉變換STFT單元,用于獲取至少兩個(gè)通道聲音信號(hào),并對(duì)各個(gè)通道聲音 信號(hào)進(jìn)行短時(shí)傅里葉變換STFT,獲取所述各個(gè)通道聲音信號(hào)對(duì)應(yīng)的頻域音頻信號(hào);
[0022] 第一獲取單元,用于根據(jù)預(yù)先設(shè)置的多方向的權(quán)向量和所述各個(gè)通道聲音信號(hào)對(duì) 應(yīng)的頻域音頻信號(hào)獲取每個(gè)頻點(diǎn)的音頻信號(hào)對(duì)應(yīng)波束群的波束形成輸出信號(hào);
[0023] 第二獲取單元,用于根據(jù)同一方向的不同頻點(diǎn)的波束能量獲取所述波束群的輸出 方向;
[0024] 逆變換單元,用于獲取所述方向上波束形成后輸出的時(shí)域聲音信號(hào)。
[0025] 優(yōu)選地,所述第一獲取單元,用于:
[0026] 根據(jù)預(yù)先設(shè)置的多方向的權(quán)向量,選取全部或部分通道聲音信號(hào)對(duì)應(yīng)的頻域音頻 信號(hào),獲取每個(gè)頻點(diǎn)的音頻信號(hào)對(duì)應(yīng)波束群的波束形成輸出信號(hào)
[0027] 優(yōu)選地,所述第二獲取單元,用于:
[0028] 對(duì)同一方向的不同頻點(diǎn)的波束能量進(jìn)行求和,并選取波束能量最大的方向作為輸 出方向。
[0029] 優(yōu)選地,所述第二獲取單元還用于:
[0030] 對(duì)同一方向的預(yù)先設(shè)置的第一頻率至第二頻率之間的所有頻點(diǎn)的波束能量進(jìn)行 求和,并選取波束能量最大的方向作為輸出方向。
[0031] 優(yōu)選地,所述多方向的權(quán)向量是基于延時(shí)累加波束形成算法、線性約束最小方差 波束形成算法、廣義旁瓣抵消波束形成算法或者最小方差無(wú)畸變響應(yīng)法MVDR得到的。
[0032] 優(yōu)選地,其特征在于,所述裝置還包括增益單元,用于對(duì)所述輸出方向上波束形成 后輸出的各頻點(diǎn)的音頻信號(hào)乘以增益,所述增益為與頻域值正比例相關(guān)的值。
[0033] 優(yōu)選地,所述增益在預(yù)先設(shè)置的不同頻域值范圍內(nèi),與頻域值有不同的正比例關(guān) 系。
[0034] 本發(fā)明通過(guò)獲取至少兩個(gè)通道聲音信號(hào),并對(duì)各個(gè)通道聲音信號(hào)進(jìn)行短時(shí)傅里葉 變換STFT,獲取所述各個(gè)通道聲音信號(hào)對(duì)應(yīng)的頻域音頻信號(hào);根據(jù)預(yù)先設(shè)置的多方向的權(quán) 向量和所述各個(gè)通道聲音信號(hào)對(duì)應(yīng)的頻域音頻信號(hào)獲取每個(gè)頻點(diǎn)的音頻信號(hào)對(duì)應(yīng)波束群 的波束形成輸出信號(hào);根據(jù)同一方向的不同頻點(diǎn)的波束能量獲取所述波束群的輸出方向; 獲取所述方向上波束形成后輸出的時(shí)域聲音信號(hào),本發(fā)明采用基于頻域的寬帶波束形成算 法有效地提高了接收語(yǔ)音的增益,采用自適應(yīng)選擇最佳波束的方式,規(guī)避了提供期望信號(hào) 到達(dá)方向等先驗(yàn)信息,減小了算法復(fù)雜度,增加了算法的適用范圍。所用的頻域波束形成算 法有利于對(duì)信號(hào)頻譜的精細(xì)調(diào)整,方便與其它的前后處理算法進(jìn)行融合,同時(shí),本發(fā)明易于 實(shí)現(xiàn),計(jì)算量小,適用于各種嵌入式平臺(tái)。
【附圖說(shuō)明】
[0035] 圖1為本發(fā)明信號(hào)處理的方法第一實(shí)施例的流程示意圖;
[0036] 圖2為本發(fā)明波束形成的方法示意圖;
[0037] 圖3為步驟103的細(xì)化流程示意圖;
[0038] 圖4為本發(fā)明提供的一種L型的三維空間麥克風(fēng)陣列的示意圖;
[0039] 圖5為本發(fā)明信號(hào)處理的方法第二實(shí)施例的流程示意圖;
[0040] 圖6為本發(fā)明信號(hào)處理的裝置第一實(shí)施例的功能模塊示意圖;
[0041] 圖7為本發(fā)明信號(hào)處理的裝置第二實(shí)施例的功能模塊示意圖。
[0042] 本發(fā)明目的的實(shí)現(xiàn)、功能特點(diǎn)及優(yōu)點(diǎn)將結(jié)合實(shí)施例,參照附圖做進(jìn)一步說(shuō)明。
【具體實(shí)施方式】
[0043] 應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0044] 本發(fā)明提供一種信號(hào)處理的方法。
[0045] 實(shí)施例一:
[0046] 參照?qǐng)D1,圖1為本發(fā)明信號(hào)處理的方法第一實(shí)施例的流程示意圖。
[0047] 在第一實(shí)施例中,該信號(hào)處理的方法包括:
[0048] 步驟101,獲取至少兩個(gè)通道聲音信號(hào),并對(duì)各個(gè)通道聲音信號(hào)進(jìn)行短時(shí)傅里葉變 換STFT,獲取所述各個(gè)通道聲音信號(hào)對(duì)應(yīng)的頻域音頻信號(hào);
[0049] 具體的,采集N個(gè)麥克風(fēng)的聲音信號(hào)(N> = 2),對(duì)每一個(gè)麥克風(fēng)接收到的時(shí)域信號(hào) 進(jìn)行短時(shí)傅里葉變換(short-time Fourier transform, STFT),得到該麥克風(fēng)接收信號(hào)各 頻點(diǎn)的數(shù)據(jù)。
[0050] 對(duì)各個(gè)麥克風(fēng)信號(hào)采用相同的分幀方法進(jìn)行短時(shí)傅里葉變換,幀與幀之間部分重 疊,重疊的方式可以有多種,本實(shí)施例采用1/4幀移的方式進(jìn)行分幀,當(dāng)然也可以采用1/2 中貞移等其他方式;將第η個(gè)麥克風(fēng)幀信號(hào)s n(i)乘上窗函數(shù)w(i),本實(shí)施例使用hamming 窗,得到加窗幀信號(hào)xn(i);然后,對(duì)加窗后的幀信號(hào)進(jìn)行短時(shí)傅里葉變換,得到頻域的幀數(shù) 據(jù),即:
[0051] Xn(f) = fft(xn(i)) (1)
[0052] 其中,i = 1,…,L, L為帖數(shù)據(jù)長(zhǎng)度,f為頻點(diǎn)。
[0053] 步驟102,根據(jù)預(yù)先設(shè)置的多方向的權(quán)向量和所述各個(gè)通道聲音信號(hào)對(duì)應(yīng)的頻域 音頻信號(hào)獲取每個(gè)頻點(diǎn)的音頻信號(hào)對(duì)應(yīng)