日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

用于語音識別系統(tǒng)的增益處理方法及裝置的制造方法_4

文檔序號:9598799閱讀:來源:國知局
以被認為是 用于實現(xiàn)邏輯功能的可執(zhí)行指令的定序列表,可以具體實現(xiàn)在任何計算機可讀介質(zhì)中,以 供指令執(zhí)行系統(tǒng)、裝置或設備(如基于計算機的系統(tǒng)、包括處理器的系統(tǒng)或其他可以從指 令執(zhí)行系統(tǒng)、裝置或設備取指令并執(zhí)行指令的系統(tǒng))使用,或結(jié)合這些指令執(zhí)行系統(tǒng)、裝置 或設備而使用。就本說明書而言,"計算機可讀介質(zhì)"可以是任何可以包含、存儲、通信、傳 播或傳輸程序以供指令執(zhí)行系統(tǒng)、裝置或設備或結(jié)合這些指令執(zhí)行系統(tǒng)、裝置或設備而使 用的裝置。計算機可讀介質(zhì)的更具體的示例(非窮盡性列表)包括以下:具有一個或多個 布線的電連接部(電子裝置),便攜式計算機盤盒(磁裝置),隨機存取存儲器(RAM),只讀 存儲器(ROM),可擦除可編輯只讀存儲器(EPROM或閃速存儲器),光纖裝置,以及便攜式光 盤只讀存儲器(CDR0M)。另外,計算機可讀介質(zhì)甚至可以是可在其上打印所述程序的紙或其 他合適的介質(zhì),因為可以例如通過對紙或其他介質(zhì)進行光學掃描,接著進行編輯、解譯或必 要時以其他合適方式進行處理來以電子方式獲得所述程序,然后將其存儲在計算機存儲器 中。
[0148] 應當理解,本申請的各部分可以用硬件、軟件、固件或它們的組合來實現(xiàn)。在上述 實施方式中,多個步驟或方法可以用存儲在存儲器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件 或固件來實現(xiàn)。例如,如果用硬件來實現(xiàn),和在另一實施方式中一樣,可用本領(lǐng)域公知的下 列技術(shù)中的任一項或他們的組合來實現(xiàn):具有用于對數(shù)據(jù)信號實現(xiàn)邏輯功能的邏輯門電路 的離散邏輯電路,具有合適的組合邏輯門電路的專用集成電路,可編程門陣列(PGA),現(xiàn)場 可編程門陣列(FPGA)等。
[0149] 本技術(shù)領(lǐng)域的普通技術(shù)人員可以理解實現(xiàn)上述實施例方法攜帶的全部或部分步 驟是可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲于一種計算機可讀存儲介 質(zhì)中,該程序在執(zhí)行時,包括方法實施例的步驟之一或其組合。
[0150] 此外,在本申請各個實施例中的各功能單元可以集成在一個處理模塊中,也可以 是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個模塊中。上述集成的模 塊既可以采用硬件的形式實現(xiàn),也可以采用軟件功能模塊的形式實現(xiàn)。所述集成的模塊如 果以軟件功能模塊的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,也可以存儲在一個計算機 可讀取存儲介質(zhì)中。
[0151] 上述提到的存儲介質(zhì)可以是只讀存儲器,磁盤或光盤等。盡管上面已經(jīng)示出和描 述了本申請的實施例,可以理解的是,上述實施例是示例性的,不能理解為對本申請的限 制,本領(lǐng)域的普通技術(shù)人員在本申請的范圍內(nèi)可以對上述實施例進行變化、修改、替換和變 型。
【主權(quán)項】
1. 一種用于語音識別系統(tǒng)的增益處理方法,其特征在于,包括以下步驟: 從輸入的預設幀長的第一音頻數(shù)據(jù)中,根據(jù)預設的分割長度獲取每個音頻段的峰值; 根據(jù)每個音頻段的峰值以及預設的音頻期望幅值,獲取每個音頻段的分塊增益,其中, 所述音頻期望幅值與語音識別系統(tǒng)中的訓練數(shù)據(jù)匹配; 從所有分塊增益中從小到大選擇預設的Μ個分塊增益值進行中值濾波處理,獲取所述 第一音頻數(shù)據(jù)的期望增益; 應用所述期望增益對所述第一音頻數(shù)據(jù)進行幅度調(diào)整。2. 如權(quán)利要求1所述的方法,其特征在于,所述獲取所述第一音頻數(shù)據(jù)的期望增益之 后,還包括: 確定所述第一音頻數(shù)據(jù)的類型; 根據(jù)所述第一音頻數(shù)據(jù)的前一幀音頻數(shù)據(jù)的歷史期望增益,獲取與所述第一音頻數(shù)據(jù) 的類型對應的修正增益,并對所述期望增益進行更新; 應用所述修正增益對所述第一音頻數(shù)據(jù)進行幅度調(diào)整。3. 如權(quán)利要求2所述的方法,其特征在于,所述確定所述第一音頻數(shù)據(jù)的類型,包括: 獲取所述每個音頻段的語音活動檢測信息; 若判斷獲知所有語音活動檢測信息的總和大于等于預設門限值,則確定所述第一音頻 數(shù)據(jù)為語音類型; 若判斷獲知所有語音活動檢測信息的總和小于所述門限值,則確定所述第一音頻數(shù)據(jù) 為噪音類型。4. 如權(quán)利要求2所述的方法,其特征在于,若確定所述第一音頻數(shù)據(jù)為噪音類型,所述 根據(jù)所述第一音頻數(shù)據(jù)的前一幀音頻數(shù)據(jù)的歷史期望增益,獲取與所述第一音頻數(shù)據(jù)的類 型對應的修正增益,包括: 應用所述前一幀音頻數(shù)據(jù)的歷史期望增益作為所述修正增益。5. 如權(quán)利要求2所述的方法,其特征在于,若確定所述第一音頻數(shù)據(jù)為語音類型,所述 根據(jù)所述第一音頻數(shù)據(jù)的前一幀音頻數(shù)據(jù)的歷史期望增益,獲取與所述第一音頻數(shù)據(jù)的類 型對應的修正增益,包括: 根據(jù)預設的跟蹤窗長獲取所述第一音頻數(shù)據(jù)的前Ν幀音頻數(shù)據(jù)的Ν個歷史期望增益, 其中,Ν等于所述跟蹤窗長與所述預設幀長的比值; 從所述Ν個歷史期望增益和所述期望增益中取最小值為參考增益; 根據(jù)所述前一幀音頻數(shù)據(jù)的歷史期望增益、預設的增益平滑因子、所述參考增益獲取 所述修正增益。6. 如權(quán)利要求5所述的方法,其特征在于,所述從所述Ν個歷史期望增益和所述期望增 益中取最小值為參考增益之后,還包括: 若判斷獲知所述參考增益在預設的增益持續(xù)時長內(nèi)沒有變化,則根據(jù)所述跟蹤窗長和 預設的更新算法對所述參考增益進行更新。7. 如權(quán)利要求5所述的方法,其特征在于,所述從所述Ν個歷史期望增益和所述期望增 益中取最小值為參考增益之后,還包括: 根據(jù)所述期望增益和所述參考增益,以及預設的語音矯正算法確定所述第一音頻數(shù)據(jù) 是否為語音類型; 若確定所述第一音頻數(shù)據(jù)為噪音類型,則應用所述參考增益作為所述修正增益。8. 如權(quán)利要求2-7任一所述的方法,其特征在于,所述獲取與所述第一音頻數(shù)據(jù)的類 型對應的第一修正增益之后,還包括: 比較所述修正增益與最小的分塊增益; 若所述修正增益大于所述最小的分塊增益,則應用最小的分塊增益更新所述修正增 益; 應用所述最小的分塊增益對所述第一音頻數(shù)據(jù)進行幅度調(diào)整。9. 一種用于語音識別系統(tǒng)的增益處理裝置,其特征在于,包括: 第一獲取模塊,用于從輸入的預設幀長的第一音頻數(shù)據(jù)中,根據(jù)預設的分割長度獲取 每個音頻段的峰值; 第二獲取模塊,用于根據(jù)每個音頻段的峰值以及預設的音頻期望幅值,獲取每個音頻 段的分塊增益,其中,所述音頻期望幅值與語音識別系統(tǒng)中的訓練數(shù)據(jù)匹配; 第一處理模塊,用于從所有分塊增益中從小到大選擇預設的Μ個分塊增益值進行中值 濾波處理,獲取所述第一音頻數(shù)據(jù)的期望增益; 調(diào)整模塊,用于應用所述期望增益對所述第一音頻數(shù)據(jù)進行幅度調(diào)整。10. 如權(quán)利要求9所述的裝置,其特征在于,還包括: 確定模塊,用于在所述獲取所述第一音頻數(shù)據(jù)的期望增益之后,確定所述第一音頻數(shù) 據(jù)的類型; 第二處理模塊,用于根據(jù)所述第一音頻數(shù)據(jù)的前一幀音頻數(shù)據(jù)的歷史期望增益,獲取 與所述第一音頻數(shù)據(jù)的類型對應的修正增益,并對所述期望增益進行更新; 所述調(diào)整模塊,還用于應用所述修正增益對所述第一音頻數(shù)據(jù)進行幅度調(diào)整。11. 如權(quán)利要求10所述的裝置,其特征在于,所述確定模塊,包括: 獲取單元,用于獲取所述每個音頻段的語音活動檢測信息; 判斷單元,用于若判斷獲知所有語音活動檢測信息的總和大于等于預設門限值,則確 定所述第一音頻數(shù)據(jù)為語音類型;若判斷獲知所有語音活動檢測信息的總和小于所述門限 值,則確定所述第一音頻數(shù)據(jù)為噪音類型。12. 如權(quán)利要求10所述的裝置,其特征在于,若確定所述第一音頻數(shù)據(jù)為噪音類型,所 述第二處理模塊,具體用于: 應用所述前一幀音頻數(shù)據(jù)的歷史期望增益作為所述修正增益。13. 如權(quán)利要求10所述的裝置,其特征在于,若確定所述第一音頻數(shù)據(jù)為語音類型,所 述第二處理模塊,具體用于: 根據(jù)預設的跟蹤窗長獲取所述第一音頻數(shù)據(jù)的前Ν幀音頻數(shù)據(jù)的Ν個歷史期望增益, 其中,Ν等于所述跟蹤窗長與所述預設幀長的比值; 從所述Ν個歷史期望增益和所述期望增益中取最小值為參考增益; 根據(jù)所述前一幀音頻數(shù)據(jù)的歷史期望增益、預設的增益平滑因子、所述參考增益獲取 所述修正增益。14. 如權(quán)利要求13所述的裝置,其特征在于,所述第二處理模塊還用于: 若判斷獲知所述參考增益在預設的增益持續(xù)時長內(nèi)沒有變化,則根據(jù)所述跟蹤窗長和 預設的更新算法對所述參考增益進行更新。15. 如權(quán)利要求13所述的裝置,其特征在于,所述第二處理模塊還用于: 根據(jù)所述期望增益和所述參考增益,以及預設的語音矯正算法確定所述第一音頻數(shù)據(jù) 是否為語音類型; 若確定所述第一音頻數(shù)據(jù)為噪音類型,則應用所述參考增益作為所述修正增益。16. 如權(quán)利要求9-15任一所述的裝置,其特征在于,還包括: 第三處理模塊,用于在所述獲取與所述第一音頻數(shù)據(jù)的類型對應的第一修正增益之 后,比較所述修正增益與最小的分塊增益,若所述修正增益大于所述最小的分塊增益,則應 用最小的分塊增益更新所述修正增益; 所述調(diào)整模塊,還用于應用所述最小的分塊增益對所述第一音頻數(shù)據(jù)進行幅度調(diào)整。
【專利摘要】本申請?zhí)岢鲆环N用于語音識別系統(tǒng)的增益處理方法和裝置,其中,該方法包括:從輸入的預設幀長的第一音頻數(shù)據(jù)中,根據(jù)預設的分割長度獲取每個音頻段的峰值;根據(jù)每個音頻段的峰值以及預設的音頻期望幅值,獲取每個音頻段的分塊增益,其中,音頻期望幅值與語音識別系統(tǒng)中的訓練數(shù)據(jù)匹配;從所有分塊增益中從小到大選擇預設的M個分塊增益值進行中值濾波處理,獲取所述第一音頻數(shù)據(jù)的期望增益;應用期望增益對第一音頻數(shù)據(jù)進行幅度調(diào)整。實現(xiàn)了對音頻數(shù)據(jù)進行自動的增益調(diào)整,使得接收到的音頻信號的幅值大于語音識別系統(tǒng)的門限值,且與訓練數(shù)據(jù)相匹配,提高了語音識別系統(tǒng)的穩(wěn)健性。
【IPC分類】G10L15/06, G10L15/26, G10L15/02
【公開號】CN105355197
【申請?zhí)枴緾N201510729439
【發(fā)明人】徐楊飛, 魏建強, 崔瑋瑋
【申請人】百度在線網(wǎng)絡技術(shù)(北京)有限公司
【公開日】2016年2月24日
【申請日】2015年10月30日
當前第4頁1 2 3 4 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1