本申請涉及語音信號處理,尤其涉及語音信號處理方法、語音信號處理設備及存儲介質。
背景技術:
1、在相關的噪聲處理方式中,通常通過譜減法、維納濾波及自適應濾波的方式對復雜環(huán)境噪聲進行處理。然而,這些處理方式依賴于對噪聲的準確估計,并且在處理非平穩(wěn)噪聲或與語音信號頻率相近的噪聲時存在局限性,使得噪聲估計不準確,容易引入偽影或出現(xiàn)失真的情況,導致去噪效果差。
2、上述內容僅用于輔助理解本申請的技術方案,并不代表承認上述內容是現(xiàn)有技術。
技術實現(xiàn)思路
1、本申請的主要目的在于提供一種語音信號處理方法、語音信號處理設備及存儲介質,旨在解決相關噪聲處理技術中,去噪效果差的技術問題。
2、為實現(xiàn)上述目的,本申請?zhí)岢鲆环N語音信號處理方法,所述方法包括:
3、獲取當前環(huán)境的環(huán)境音頻信號;
4、對所述環(huán)境音頻信號進行頻域轉換及特征提取處理,并確定頻域轉換及特征提取后的所述環(huán)境音頻信號的環(huán)境噪聲估計值;
5、接收到待處理語音信號時,基于所述環(huán)境噪聲估計值以及深度神經網絡對所述待處理語音信號進行去噪處理,得到去噪后的第一語音信號。
6、在一實施例中,所述接收到待處理語音信號時,基于所述環(huán)境噪聲估計值以及深度神經網絡對所述待處理語音信號進行去噪處理,得到去噪后的第一語音信號的步驟包括:
7、接收到所述待處理語音信號時,將所述待處理語音信號轉換為頻域信號;
8、將所述頻域信號以及所述環(huán)境噪聲估計值輸入到所述深度神經網絡中,并基于所述深度神經網絡對所述頻域信號進行去噪處理,得到所述第一語音信號。
9、在一實施例中,所述接收到待處理語音信號時,基于所述環(huán)境噪聲估計值以及深度神經網絡對所述待處理語音信號進行去噪處理,得到去噪后的第一語音信號的步驟之后,還包括:
10、基于所述第一語音信號以及所述環(huán)境噪聲估計值,確定所述第一語音信號對應的目標增益值;
11、基于所述目標增益值,通過自動增益控制算法對所述第一語音信號進行增益調整,得到第二語音信號。
12、在一實施例中,所述基于所述第一語音信號以及所述環(huán)境噪聲估計值,確定所述第一語音信號對應的目標增益值的步驟包括:
13、基于語音活動檢測模塊以及所述環(huán)境噪聲估計值,對所述第一語音信號進行信號區(qū)分,得到待增益語音信號與其他語音信號;
14、根據包絡檢測模塊確定所述待增益語音信號以及所述其他語音信號的信號強度,并基于所述信號強度確定環(huán)境嘈雜度;
15、基于所述環(huán)境嘈雜度生成所述目標增益值。
16、在一實施例中,所述對所述環(huán)境音頻信號進行頻域轉換及特征提取處理,并確定頻域轉換及特征提取后的所述環(huán)境音頻信號的環(huán)境噪聲估計值的步驟包括:
17、對所述環(huán)境音頻信號進行短時傅里葉變換處理,得到預設頻域信號;
18、基于卷積神經網絡對所述預設頻域信號進行特征提取處理,并根據提取的特征,生成所述環(huán)境音頻信號的噪聲水平和噪聲類型的估計值;
19、將所述噪聲水平和所述噪聲類型的估計值,設置為所述環(huán)境噪聲估計值。
20、在一實施例中,所述接收到待處理語音信號時,基于所述環(huán)境噪聲估計值以及深度神經網絡對所述待處理語音信號進行去噪處理,得到去噪后的第一語音信號的步驟之后,還包括:
21、確定用戶的聽力特征曲線以及音頻偏好模型;
22、基于所述聽力特征曲線以及所述音頻偏好模型,生成音頻調整參數;
23、根據所述音頻調整參數對所述第一語音信號進行音頻調整,得到第三語音信號。
24、在一實施例中,所述確定用戶的聽力特征曲線以及音頻偏好模型的步驟包括:
25、確定所述用戶的音頻播放歷史和反饋數據,并基于所述音頻播放歷史對預存的學習模型進行訓練,基于所述反饋數據對訓練后的模型進行迭代優(yōu)化,得到所述音頻偏好模型;
26、獲取所述用戶的聽力測試數據,并根據所述聽力測試數據確定所述聽力特征曲線。
27、在一實施例中,所述接收到待處理語音信號時,基于所述環(huán)境噪聲估計值以及深度神經網絡對所述待處理語音信號進行去噪處理,得到去噪后的第一語音信號的步驟之后,還包括:
28、確定所述第一語音信號與所述深度神經網絡生成的預測音頻信號之間的偏差值;
29、基于所述偏差值對所述深度神經網絡進行迭代優(yōu)化處理。
30、此外,為實現(xiàn)上述目的,本申請還提出一種語音信號處理設備,所述語音信號處理設備包括:存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,所述計算機程序配置為實現(xiàn)如上文所述的語音信號處理方法的步驟。
31、此外,為實現(xiàn)上述目的,本申請還提出一種存儲介質,所述存儲介質為計算機可讀存儲介質,所述存儲介質上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)如上文所述的語音信號處理方法的步驟。
32、本申請?zhí)岢龅囊粋€或多個技術方案,至少具有以下技術效果:
33、對待處理語音信號進行降噪處理時,先獲取當前的環(huán)境音頻信號,并基于環(huán)境音頻信號計算環(huán)境噪聲估計值,以便深度神經網絡對語音信號進行處理時,能夠結合環(huán)境噪聲估計值將語音信號中的語音和噪聲進行有效分離,從而增強語音輸出效果,并提高語音信號的去噪效果。
1.一種語音信號處理方法,其特征在于,所述方法包括:
2.如權利要求1所述的方法,其特征在于,所述接收到待處理語音信號時,基于所述環(huán)境噪聲估計值以及深度神經網絡對所述待處理語音信號進行去噪處理,得到去噪后的第一語音信號的步驟包括:
3.如權利要求1所述的方法,其特征在于,所述接收到待處理語音信號時,基于所述環(huán)境噪聲估計值以及深度神經網絡對所述待處理語音信號進行去噪處理,得到去噪后的第一語音信號的步驟之后,還包括:
4.如權利要求3所述的方法,其特征在于,所述基于所述第一語音信號以及所述環(huán)境噪聲估計值,確定所述第一語音信號對應的目標增益值的步驟包括:
5.如權利要求1所述的方法,其特征在于,所述對所述環(huán)境音頻信號進行頻域轉換及特征提取處理,并確定頻域轉換及特征提取后的所述環(huán)境音頻信號的環(huán)境噪聲估計值的步驟包括:
6.如權利要求1所述的方法,其特征在于,所述接收到待處理語音信號時,基于所述環(huán)境噪聲估計值以及深度神經網絡對所述待處理語音信號進行去噪處理,得到去噪后的第一語音信號的步驟之后,還包括:
7.如權利要求6所述的方法,其特征在于,所述確定用戶的聽力特征曲線以及音頻偏好模型的步驟包括:
8.如權利要求1所述的方法,其特征在于,所述接收到待處理語音信號時,基于所述環(huán)境噪聲估計值以及深度神經網絡對所述待處理語音信號進行去噪處理,得到去噪后的第一語音信號的步驟之后,還包括:
9.一種語音信號處理設備,其特征在于,所述語音信號處理設備包括:存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,所述計算機程序配置為實現(xiàn)如權利要求1至8中任一項所述的語音信號處理方法的步驟。
10.一種存儲介質,其特征在于,所述存儲介質為計算機可讀存儲介質,所述存儲介質上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)如權利要求1至8中任一項所述的語音信號處理方法的步驟。