一種基于智能化語(yǔ)音識(shí)別技術(shù)的助聽(tīng)器系統(tǒng)的制作方法
【專(zhuān)利摘要】本發(fā)明提供了一種基于智能化語(yǔ)音識(shí)別技術(shù)的助聽(tīng)器系統(tǒng),涉及醫(yī)療設(shè)備領(lǐng)域,其特征在于,所述系統(tǒng)包括:識(shí)別端、移動(dòng)端和云端;所述識(shí)別端包括:聲音采集裝置、信號(hào)轉(zhuǎn)換裝置、分解濾波器、增強(qiáng)系統(tǒng)、預(yù)處理計(jì)算裝置、判決系統(tǒng)、合成濾波器、數(shù)據(jù)發(fā)送裝置、本地?cái)?shù)據(jù)庫(kù)和數(shù)據(jù)接收裝置;所述移動(dòng)端包括:控制器、處理器、顯示器、語(yǔ)音識(shí)別裝置和移動(dòng)數(shù)據(jù)傳輸裝置;所述云端包括:云端數(shù)據(jù)傳輸裝置、云端數(shù)據(jù)庫(kù)和云端分析處理器。該系統(tǒng)具有中文語(yǔ)音識(shí)別準(zhǔn)確、具備自我學(xué)習(xí)能力、識(shí)別算法領(lǐng)先、后期維護(hù)好等優(yōu)點(diǎn)。
【專(zhuān)利說(shuō)明】一種基于智能化語(yǔ)音識(shí)別技術(shù)的助聽(tīng)器系統(tǒng)
[0001]
技術(shù)領(lǐng)域
[0002]本發(fā)明涉及醫(yī)療領(lǐng)域,特別是涉及一種基于智能化語(yǔ)音識(shí)別技術(shù)的助聽(tīng)器系統(tǒng)。
【背景技術(shù)】
[0003]目前國(guó)外對(duì)助聽(tīng)器研究發(fā)展的一個(gè)熱點(diǎn)則是集中在中國(guó),確切地講是基于對(duì)漢語(yǔ)語(yǔ)言和語(yǔ)音研究,開(kāi)發(fā)相關(guān)的語(yǔ)音識(shí)別技術(shù)和產(chǎn)品。聽(tīng)覺(jué)科學(xué)是一門(mén)發(fā)展迅速、知識(shí)更新很快的一門(mén)學(xué)科,它所研究的對(duì)象以人的聽(tīng)覺(jué)為中心,現(xiàn)在我們將介紹和討論科學(xué)家和聽(tīng)力學(xué)家更關(guān)心的是怎樣將聽(tīng)覺(jué)科學(xué)運(yùn)用到中國(guó)人的聽(tīng)覺(jué)和言語(yǔ)實(shí)際中去。
[0004]漢語(yǔ)是具有特征化的音調(diào)性語(yǔ)言,與其他以拼音字母為主的語(yǔ)系,如斯拉夫語(yǔ)系等具有很明顯的語(yǔ)音學(xué)差別。這種差別不僅僅在語(yǔ)言特征上非常明確,在具體使用時(shí),區(qū)別也很大。是否不同語(yǔ)系的不同語(yǔ)音特征會(huì)影響聽(tīng)覺(jué)受損患者對(duì)言語(yǔ)的理解,尤其是在使用基于不同語(yǔ)系研究成果制作成的助聽(tīng)器時(shí),這種語(yǔ)音的差異是否起到重要作用,最近已成為學(xué)術(shù)和科研的一個(gè)熱門(mén)課題。比如國(guó)內(nèi)研制的人工耳蝸的一個(gè)特點(diǎn)便是在設(shè)計(jì)其算法時(shí)考慮到中文語(yǔ)音特點(diǎn)。國(guó)外助聽(tīng)器廠商將在近期推出以中文語(yǔ)音為特征算法的助聽(tīng)器。加拿大在中國(guó)的一語(yǔ)音實(shí)驗(yàn)室通過(guò)多年的研究和實(shí)驗(yàn),早在2000年運(yùn)用領(lǐng)先的數(shù)字信號(hào)處理(DSP)技術(shù),在其數(shù)字助聽(tīng)器中加入中文語(yǔ)音算法,并同時(shí)申請(qǐng)了相關(guān)專(zhuān)利。目前他們率先推出的以中文語(yǔ)音處理技術(shù)為核心的全新數(shù)字助聽(tīng)器一Intelligia,在臨床試驗(yàn)中得到受試者的認(rèn)可,初步證明這種新型助聽(tīng)器對(duì)說(shuō)以中文為母語(yǔ)的患者有益處。
[0005]而現(xiàn)有的數(shù)字助聽(tīng)器具有如下缺點(diǎn):
1、中文語(yǔ)音識(shí)別較差:現(xiàn)有的數(shù)字助聽(tīng)器對(duì)于中文語(yǔ)音識(shí)別效果較差,除了缺乏對(duì)于噪聲的處理外,對(duì)于中文語(yǔ)音的語(yǔ)言特性研究不細(xì)致。導(dǎo)致識(shí)別效果較差。
[0006]2、不具備學(xué)習(xí)能力:現(xiàn)有的數(shù)字助聽(tīng)器,大都是單獨(dú)的產(chǎn)品,沒(méi)有基于云端和云端的智能化處理系統(tǒng)。對(duì)于一個(gè)識(shí)別空白區(qū)或識(shí)別誤區(qū),將一直都存在問(wèn)題,無(wú)法再使用過(guò)程中進(jìn)行自我改進(jìn)。
[0007]3、識(shí)別算法落后:現(xiàn)有的中文語(yǔ)音識(shí)別算法,大都針對(duì)是單一環(huán)境或者直接將英語(yǔ)識(shí)別的方法應(yīng)用過(guò)來(lái),缺少獨(dú)立的中文語(yǔ)音識(shí)別算法。在某些特定噪聲較大的環(huán)境中,無(wú)法做到很好的識(shí)別。
[0008]4、沒(méi)有后期維護(hù):單一的設(shè)備,出售之后缺乏后期維護(hù)。沒(méi)有針對(duì)智能化的措施對(duì)整個(gè)產(chǎn)品進(jìn)行跟進(jìn),在維護(hù)過(guò)程中發(fā)現(xiàn)產(chǎn)品的不足,進(jìn)而不斷提升產(chǎn)品性能。
【發(fā)明內(nèi)容】
[0009]針對(duì)上述反外掛技術(shù)方法的缺陷,本發(fā)明提供了一種基于智能化語(yǔ)音識(shí)別技術(shù)的助聽(tīng)器系統(tǒng),該系統(tǒng)具有中文語(yǔ)音識(shí)別準(zhǔn)確、具備自我學(xué)習(xí)能力、識(shí)別算法領(lǐng)先、后期維護(hù)好等優(yōu)點(diǎn)。
[0010]本發(fā)明采用的技術(shù)方案如下:
一種基于語(yǔ)音識(shí)別技術(shù)的助聽(tīng)器系統(tǒng),其特征在于,所述系統(tǒng)包括:識(shí)別端、移動(dòng)端和云端;所述識(shí)別端包括:聲音采集裝置、信號(hào)轉(zhuǎn)換裝置、分解濾波器、增強(qiáng)系統(tǒng)、預(yù)處理計(jì)算裝置、判決系統(tǒng)、合成濾波器、數(shù)據(jù)發(fā)送裝置、本地?cái)?shù)據(jù)庫(kù)和數(shù)據(jù)接收裝置;所述移動(dòng)端包括:控制器、處理器、顯示器、語(yǔ)音識(shí)別裝置和移動(dòng)數(shù)據(jù)傳輸裝置;所述云端包括:云端數(shù)據(jù)傳輸裝置、云端數(shù)據(jù)庫(kù)和云端分析處理器;
所述聲音采集裝置信號(hào)連接于信號(hào)轉(zhuǎn)換裝置;所述信號(hào)轉(zhuǎn)換裝置信號(hào)連接于分解濾波器;所述分解濾波器信號(hào)連接于增強(qiáng)系統(tǒng);所述增強(qiáng)系統(tǒng)信號(hào)連接于預(yù)處理計(jì)算裝置、所述預(yù)處理計(jì)算裝置信號(hào)連接于判決系統(tǒng);所述判決系統(tǒng)分別信號(hào)連接于合成濾波器和本地?cái)?shù)據(jù)庫(kù);所述合成濾波器信號(hào)連接于數(shù)據(jù)發(fā)送裝置;所述本地?cái)?shù)據(jù)庫(kù)信號(hào)連接于數(shù)據(jù)接收裝置;所述數(shù)據(jù)發(fā)送裝置信號(hào)連接于移動(dòng)數(shù)據(jù)傳輸裝置;所述移動(dòng)數(shù)據(jù)傳輸裝置分別信號(hào)連接于處理器和云端數(shù)據(jù)傳輸裝置;所述處理器分別信號(hào)連接于控制器、語(yǔ)音識(shí)別裝置和顯示器;所述云端數(shù)據(jù)傳輸裝置分別信號(hào)連接于數(shù)據(jù)接收裝置數(shù)據(jù)接收裝置和云端數(shù)據(jù)庫(kù);所述云端數(shù)據(jù)庫(kù)信號(hào)連接于云端分析處理器。
[0011]所述聲音采集裝置包括:可轉(zhuǎn)向式麥克風(fēng)和強(qiáng)度識(shí)別系統(tǒng);所述強(qiáng)度識(shí)別裝置信號(hào)連接于可轉(zhuǎn)向式麥克風(fēng),用于識(shí)別出可轉(zhuǎn)向式麥克風(fēng)接收到聲音信號(hào)強(qiáng)度最強(qiáng)的方向,控制麥克風(fēng)轉(zhuǎn)向該方向;所述可轉(zhuǎn)向式麥克風(fēng),信號(hào)連接于信號(hào)轉(zhuǎn)換裝置,用于采集外部聲音信號(hào),根據(jù)聲音采集裝置發(fā)出的控制命令調(diào)整采集聲音信號(hào)的方向,以及將采集到的聲音信號(hào)發(fā)送至信號(hào)轉(zhuǎn)換裝置。
[0012]所述信號(hào)轉(zhuǎn)換裝置,用于將采集到的聲音信號(hào)從模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào);所述分解濾波器包括:分解器、偵測(cè)器;所述分解器,用于將接收到的信號(hào)分解成16個(gè)波段,進(jìn)行濾波處理后,再將16個(gè)波段的信號(hào)組成10組通道;所述偵測(cè)器包括多個(gè)偵測(cè)器組,每個(gè)偵測(cè)器組監(jiān)測(cè)一個(gè)通道的信號(hào)變化,每個(gè)偵測(cè)器組包含一個(gè)快速時(shí)間偵測(cè)器和慢速時(shí)間偵測(cè)器。
[0013]所述快速時(shí)間偵測(cè)器用于監(jiān)測(cè)變化較快的通道信號(hào),而慢速時(shí)間偵測(cè)器則偵測(cè)信號(hào)變化較慢的通道信號(hào),根據(jù)監(jiān)測(cè)結(jié)果,選用與通道信號(hào)變化相匹配的壓縮時(shí)間常數(shù)對(duì)信號(hào)進(jìn)行壓縮處理,或者選用與該通道信號(hào)變化相匹配的釋放時(shí)間常數(shù),對(duì)信號(hào)進(jìn)行釋放處理;將壓縮或釋放后的通道信號(hào)發(fā)送至增強(qiáng)系統(tǒng);所述增強(qiáng)系統(tǒng),用于增強(qiáng)所獲取的通道信號(hào)的強(qiáng)度,將增強(qiáng)后的通道信號(hào)發(fā)送至預(yù)處理計(jì)算裝置;所述預(yù)處理計(jì)算裝置包括:能量統(tǒng)計(jì)單元和增益計(jì)算單元;所述能量統(tǒng)計(jì)單元,用于統(tǒng)計(jì)接收到的通道信號(hào)的能量數(shù)據(jù),將統(tǒng)計(jì)到的能量數(shù)據(jù)和接收到的通道信號(hào)都發(fā)送至增益計(jì)算單元;所述增益計(jì)算單元,用于根據(jù)預(yù)設(shè)的增益計(jì)算方法,通過(guò)能量數(shù)據(jù)計(jì)算出用于信號(hào)識(shí)別分類(lèi)的數(shù)據(jù)信息,將接收到的通道信號(hào)和用于信號(hào)識(shí)別分類(lèi)的數(shù)據(jù)信息發(fā)送至判決系統(tǒng)。
[0014]所述判決系統(tǒng),包括分類(lèi)器、復(fù)合器、輔音判決器、聲調(diào)判決器和重音判決器;所述分類(lèi)器,用于根據(jù)預(yù)處理計(jì)算裝置發(fā)送過(guò)來(lái)的用于信號(hào)識(shí)別分類(lèi)的數(shù)據(jù)信息,將接收到的通道信號(hào)進(jìn)行分類(lèi)處理,將輔音類(lèi)通道信號(hào)發(fā)送至輔音判決器,將聲調(diào)類(lèi)信號(hào)發(fā)送至聲調(diào)判決器,將重音類(lèi)通道信號(hào)發(fā)送至重音判決器;所述輔音判決器,用于將接收到的輔音類(lèi)信號(hào)和本地?cái)?shù)據(jù)庫(kù)中的標(biāo)準(zhǔn)信號(hào)進(jìn)行比對(duì),得出準(zhǔn)確的輔音,將該輔音發(fā)送至復(fù)合器;所述聲調(diào)判決器,用于將接收到的聲調(diào)類(lèi)信號(hào)和本地?cái)?shù)據(jù)庫(kù)中的標(biāo)準(zhǔn)信號(hào)進(jìn)行比對(duì),得出準(zhǔn)確的聲調(diào),將該聲調(diào)發(fā)送至復(fù)合器;所述重音判決器,用于將接收到的重音類(lèi)信號(hào)和本地?cái)?shù)據(jù)庫(kù)中的標(biāo)準(zhǔn)信號(hào)進(jìn)行比對(duì),得出準(zhǔn)確的重音,將該重音發(fā)送至復(fù)合器;所述復(fù)合器,用于將接收到的輔音、聲調(diào)和重音進(jìn)行復(fù)合,生成完整的聲音信號(hào),將該聲音信號(hào)發(fā)送至合成濾波器。
[0015]所述合成濾波器,用于對(duì)接收到的聲音信號(hào)進(jìn)行平滑處理,和去除聲音信號(hào)中顯著的噪音信號(hào),將處理后的聲音信號(hào)發(fā)送至聽(tīng)筒和數(shù)據(jù)發(fā)送裝置;所述數(shù)據(jù)發(fā)送裝置,用于將處理后的聲音信號(hào)發(fā)送至移動(dòng)端數(shù)據(jù)傳輸裝置。
[0016]所述數(shù)據(jù)傳輸裝置將接收到的聲音信號(hào)經(jīng)處理器處理后發(fā)送至語(yǔ)音識(shí)別裝置,所述語(yǔ)音識(shí)別裝置用于將接收到的聲音信號(hào)進(jìn)行識(shí)別,轉(zhuǎn)換為文字,在顯示器中顯示出來(lái);所述控制器,用于人為根據(jù)文字信息和接收到的聲音信息,判斷識(shí)別端識(shí)別的聲音信號(hào)是否準(zhǔn)確,將判斷結(jié)果經(jīng)處理器處理后發(fā)送至云端。
[0017]所述云端分析處理器,用于將云端數(shù)據(jù)傳輸裝置接收到的數(shù)據(jù)信息進(jìn)行分析處理,統(tǒng)計(jì)分析出移動(dòng)端發(fā)送過(guò)來(lái)的識(shí)別不準(zhǔn)確的聲音信號(hào)發(fā)送至本地?cái)?shù)據(jù)庫(kù),覆蓋原有的標(biāo)準(zhǔn)信號(hào)。
[0018]所述增益計(jì)算方法包括以下步驟:
步驟I:設(shè)定獲取的信號(hào)能量數(shù)據(jù)為E(n);
步驟2:設(shè)定不同信號(hào)能量數(shù)據(jù)之間的關(guān)系為:E (n)= a E(n_l),其中:a是時(shí)間常數(shù)
,
步驟3:使用倒譜算法提取基頻;其中,倒譜算法中,采用512個(gè)點(diǎn)的快速傅里葉變換和窗移為1ms的40ms的漢明窗;
步驟4:用一個(gè)簡(jiǎn)單的滑動(dòng)平均算法對(duì)每個(gè)音節(jié)測(cè)到的基頻進(jìn)行平滑處理,剔除那些平滑段內(nèi)偏離均值過(guò)大的值;
步驟5:將音高和音長(zhǎng)分別進(jìn)行歸一化處理;
步驟6:采用一個(gè)二次曲線在最小均方誤差的意義下逼近基音軌跡。并計(jì)算曲線的一次斜率、二次斜率、谷點(diǎn)和平坦度。
[0019]采用上述技術(shù)方案,本發(fā)明產(chǎn)生了以下有益效果:
1、中文語(yǔ)音識(shí)別準(zhǔn)確:該系統(tǒng)提供獨(dú)特的方向控制方法,準(zhǔn)確控制話筒方向,使得搜集到的語(yǔ)音信號(hào)更加清晰和準(zhǔn)確;同時(shí),將中文語(yǔ)音進(jìn)行分解、濾波、能量增強(qiáng)等處理。將中文語(yǔ)音分解為輔音、重音和聲調(diào)后進(jìn)行處理??梢宰畲蟪潭壬显鰪?qiáng)中文語(yǔ)音是別的準(zhǔn)確性。
[0020]2、具備學(xué)習(xí)能力:本系統(tǒng)采用的移動(dòng)端判斷語(yǔ)音和云端大數(shù)據(jù)分析等手段,可以針對(duì)識(shí)別結(jié)果進(jìn)行自主判斷,進(jìn)而進(jìn)行大數(shù)據(jù)統(tǒng)計(jì)分析處理,發(fā)現(xiàn)是被過(guò)程中誤判率較高的音調(diào)和聲調(diào),再將本地?cái)?shù)據(jù)庫(kù)中的標(biāo)準(zhǔn)信號(hào)進(jìn)行替換,使得下一次遇到該聲調(diào)和音調(diào)后不再出現(xiàn)誤判。
[0021]3、識(shí)別算法先進(jìn):自主研發(fā)的中文語(yǔ)音識(shí)別算法,能夠適應(yīng)復(fù)雜情景的語(yǔ)音識(shí)別,將信號(hào)能量作為語(yǔ)音識(shí)別中的重要要素,可以刨除其他因素的影響。
[0022]4、后期維護(hù)強(qiáng):產(chǎn)品出售后,針對(duì)用戶(hù)的反饋,可以進(jìn)行大數(shù)據(jù)分析,針對(duì)分析結(jié)果,可以不斷調(diào)整算法和處理方法,優(yōu)化產(chǎn)品,提供產(chǎn)品升級(jí)等處理方案。
【附圖說(shuō)明】
[0023]圖1是本發(fā)明實(shí)施例以一種基于智能化語(yǔ)音識(shí)別技術(shù)的助聽(tīng)器系統(tǒng)。
【具體實(shí)施方式】
[0024]本說(shuō)明書(shū)中公開(kāi)的所有特征,或公開(kāi)的所有方法或過(guò)程中的步驟,除了互相排斥的特征和/或步驟以外,均可以以任何方式組合。
[0025]本說(shuō)明書(shū)(包括任何附加權(quán)利要求、摘要)中公開(kāi)的任一特征,除非特別敘述,均可被其他等效或具有類(lèi)似目的的替代特征加以替換。即,除非特別敘述,每個(gè)特征只是一系列等效或類(lèi)似特征中的一個(gè)例子而已。
[0026]本發(fā)明實(shí)施例1中提供了一種基于智能化語(yǔ)音識(shí)別技術(shù)的助聽(tīng)器系統(tǒng),流程圖如圖1所示,具體步驟如下:
一種基于語(yǔ)音識(shí)別技術(shù)的助聽(tīng)器系統(tǒng),其特征在于,所述系統(tǒng)包括:識(shí)別端、移動(dòng)端和云端;所述識(shí)別端包括:聲音采集裝置、信號(hào)轉(zhuǎn)換裝置、分解濾波器、增強(qiáng)系統(tǒng)、預(yù)處理計(jì)算裝置、判決系統(tǒng)、合成濾波器、數(shù)據(jù)發(fā)送裝置、本地?cái)?shù)據(jù)庫(kù)和數(shù)據(jù)接收裝置;所述移動(dòng)端包括:控制器、處理器、顯示器、語(yǔ)音識(shí)別裝置和移動(dòng)數(shù)據(jù)傳輸裝置;所述云端包括:云端數(shù)據(jù)傳輸裝置、云端數(shù)據(jù)庫(kù)和云端分析處理器;
所述聲音采集裝置信號(hào)連接于信號(hào)轉(zhuǎn)換裝置;所述信號(hào)轉(zhuǎn)換裝置信號(hào)連接于分解濾波器;所述分解濾波器信號(hào)連接于增強(qiáng)系統(tǒng);所述增強(qiáng)系統(tǒng)信號(hào)連接于預(yù)處理計(jì)算裝置、所述預(yù)處理計(jì)算裝置信號(hào)連接于判決系統(tǒng);所述判決系統(tǒng)分別信號(hào)連接于合成濾波器和本地?cái)?shù)據(jù)庫(kù);所述合成濾波器信號(hào)連接于數(shù)據(jù)發(fā)送裝置;所述本地?cái)?shù)據(jù)庫(kù)信號(hào)連接于數(shù)據(jù)接收裝置;所述數(shù)據(jù)發(fā)送裝置信號(hào)連接于移動(dòng)數(shù)據(jù)傳輸裝置;所述移動(dòng)數(shù)據(jù)傳輸裝置分別信號(hào)連接于處理器和云端數(shù)據(jù)傳輸裝置;所述處理器分別信號(hào)連接于控制器、語(yǔ)音識(shí)別裝置和顯示器;所述云端數(shù)據(jù)傳輸裝置分別信號(hào)連接于數(shù)據(jù)接收裝置數(shù)據(jù)接收裝置和云端數(shù)據(jù)庫(kù);所述云端數(shù)據(jù)庫(kù)信號(hào)連接于云端分析處理器。
[0027]所述聲音采集裝置包括:可轉(zhuǎn)向式麥克風(fēng)和強(qiáng)度識(shí)別系統(tǒng);所述強(qiáng)度識(shí)別裝置信號(hào)連接于可轉(zhuǎn)向式麥克風(fēng),用于識(shí)別出可轉(zhuǎn)向式麥克風(fēng)接收到聲音信號(hào)強(qiáng)度最強(qiáng)的方向,控制麥克風(fēng)轉(zhuǎn)向該方向;所述可轉(zhuǎn)向式麥克風(fēng),信號(hào)連接于信號(hào)轉(zhuǎn)換裝置,用于采集外部聲音信號(hào),根據(jù)聲音采集裝置發(fā)出的控制命令調(diào)整采集聲音信號(hào)的方向,以及將采集到的聲音信號(hào)發(fā)送至信號(hào)轉(zhuǎn)換裝置。
[0028]所述信號(hào)轉(zhuǎn)換裝置,用于將采集到的聲音信號(hào)從模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào);所述分解濾波器包括:分解器、偵測(cè)器;所述分解器,用于將接收到的信號(hào)分解成16個(gè)波段,進(jìn)行濾波處理后,再將16個(gè)波段的信號(hào)組成10組通道;所述偵測(cè)器包括多個(gè)偵測(cè)器組,每個(gè)偵測(cè)器組監(jiān)測(cè)一個(gè)通道的信號(hào)變化,每個(gè)偵測(cè)器組包含一個(gè)快速時(shí)間偵測(cè)器和慢速時(shí)間偵測(cè)器。
[0029]所述快速時(shí)間偵測(cè)器用于監(jiān)測(cè)變化較快的通道信號(hào),而慢速時(shí)間偵測(cè)器則偵測(cè)信號(hào)變化較慢的通道信號(hào),根據(jù)監(jiān)測(cè)結(jié)果,選用與通道信號(hào)變化相匹配的壓縮時(shí)間常數(shù)對(duì)信號(hào)進(jìn)行壓縮處理,或者選用與該通道信號(hào)變化相匹配的釋放時(shí)間常數(shù),對(duì)信號(hào)進(jìn)行釋放處理;將壓縮或釋放后的通道信號(hào)發(fā)送至增強(qiáng)系統(tǒng);所述增強(qiáng)系統(tǒng),用于增強(qiáng)所獲取的通道信號(hào)的強(qiáng)度,將增強(qiáng)后的通道信號(hào)發(fā)送至預(yù)處理計(jì)算裝置;所述預(yù)處理計(jì)算裝置包括:能量統(tǒng)計(jì)單元和增益計(jì)算單元;所述能量統(tǒng)計(jì)單元,用于統(tǒng)計(jì)接收到的通道信號(hào)的能量數(shù)據(jù),將統(tǒng)計(jì)到的能量數(shù)據(jù)和接收到的通道信號(hào)都發(fā)送至增益計(jì)算單元;所述增益計(jì)算單元,用于根據(jù)預(yù)設(shè)的增益計(jì)算方法,通過(guò)能量數(shù)據(jù)計(jì)算出用于信號(hào)識(shí)別分類(lèi)的數(shù)據(jù)信息,將接收到的通道信號(hào)和用于信號(hào)識(shí)別分類(lèi)的數(shù)據(jù)信息發(fā)送至判決系統(tǒng)。
[0030]所述判決系統(tǒng),包括分類(lèi)器、復(fù)合器、輔音判決器、聲調(diào)判決器和重音判決器;所述分類(lèi)器,用于根據(jù)預(yù)處理計(jì)算裝置發(fā)送過(guò)來(lái)的用于信號(hào)識(shí)別分類(lèi)的數(shù)據(jù)信息,將接收到的通道信號(hào)進(jìn)行分類(lèi)處理,將輔音類(lèi)通道信號(hào)發(fā)送至輔音判決器,將聲調(diào)類(lèi)信號(hào)發(fā)送至聲調(diào)判決器,將重音類(lèi)通道信號(hào)發(fā)送至重音判決器;所述輔音判決器,用于將接收到的輔音類(lèi)信號(hào)和本地?cái)?shù)據(jù)庫(kù)中的標(biāo)準(zhǔn)信號(hào)進(jìn)行比對(duì),得出準(zhǔn)確的輔音,將該輔音發(fā)送至復(fù)合器;所述聲調(diào)判決器,用于將接收到的聲調(diào)類(lèi)信號(hào)和本地?cái)?shù)據(jù)庫(kù)中的標(biāo)準(zhǔn)信號(hào)進(jìn)行比對(duì),得出準(zhǔn)確的聲調(diào),將該聲調(diào)發(fā)送至復(fù)合器;所述重音判決器,用于將接收到的重音類(lèi)信號(hào)和本地?cái)?shù)據(jù)庫(kù)中的標(biāo)準(zhǔn)信號(hào)進(jìn)行比對(duì),得出準(zhǔn)確的重音,將該重音發(fā)送至復(fù)合器;所述復(fù)合器,用于將接收到的輔音、聲調(diào)和重音進(jìn)行復(fù)合,生成完整的聲音信號(hào),將該聲音信號(hào)發(fā)送至合成濾波器。
[0031]所述合成濾波器,用于對(duì)接收到的聲音信號(hào)進(jìn)行平滑處理,和去除聲音信號(hào)中顯著的噪音信號(hào),將處理后的聲音信號(hào)發(fā)送至聽(tīng)筒和數(shù)據(jù)發(fā)送裝置;所述數(shù)據(jù)發(fā)送裝置,用于將處理后的聲音信號(hào)發(fā)送至移動(dòng)端數(shù)據(jù)傳輸裝置。
[0032]所述數(shù)據(jù)傳輸裝置將接收到的聲音信號(hào)經(jīng)處理器處理后發(fā)送至語(yǔ)音識(shí)別裝置,所述語(yǔ)音識(shí)別裝置用于將接收到的聲音信號(hào)進(jìn)行識(shí)別,轉(zhuǎn)換為文字,在顯示器中顯示出來(lái);所述控制器,用于人為根據(jù)文字信息和接收到的聲音信息,判斷識(shí)別端識(shí)別的聲音信號(hào)是否準(zhǔn)確,將判斷結(jié)果經(jīng)處理器處理后發(fā)送至云端。
[0033]所述云端分析處理器,用于將云端數(shù)據(jù)傳輸裝置接收到的數(shù)據(jù)信息進(jìn)行分析處理,統(tǒng)計(jì)分析出移動(dòng)端發(fā)送過(guò)來(lái)的識(shí)別不準(zhǔn)確的聲音信號(hào)發(fā)送至本地?cái)?shù)據(jù)庫(kù),覆蓋原有的標(biāo)準(zhǔn)信號(hào)。
[0034]本發(fā)明實(shí)施例2中提供了一種基于智能化語(yǔ)音識(shí)別技術(shù)的助聽(tīng)器系統(tǒng),系統(tǒng)結(jié)構(gòu)圖如圖1所示:
一種基于語(yǔ)音識(shí)別技術(shù)的助聽(tīng)器系統(tǒng),其特征在于,所述系統(tǒng)包括:識(shí)別端、移動(dòng)端和云端;所述識(shí)別端包括:聲音采集裝置、信號(hào)轉(zhuǎn)換裝置、分解濾波器、增強(qiáng)系統(tǒng)、預(yù)處理計(jì)算裝置、判決系統(tǒng)、合成濾波器、數(shù)據(jù)發(fā)送裝置、本地?cái)?shù)據(jù)庫(kù)和數(shù)據(jù)接收裝置;所述移動(dòng)端包括:控制器、處理器、顯示器、語(yǔ)音識(shí)別裝置和移動(dòng)數(shù)據(jù)傳輸裝置;所述云端包括:云端數(shù)據(jù)傳輸裝置、云端數(shù)據(jù)庫(kù)和云端分析處理器;
所述聲音采集裝置信號(hào)連接于信號(hào)轉(zhuǎn)換裝置;所述信號(hào)轉(zhuǎn)換裝置信號(hào)連接于分解濾波器;所述分解濾波器信號(hào)連接于增強(qiáng)系統(tǒng);所述增強(qiáng)系統(tǒng)信號(hào)連接于預(yù)處理計(jì)算裝置、所述預(yù)處理計(jì)算裝置信號(hào)連接于判決系統(tǒng);所述判決系統(tǒng)分別信號(hào)連接于合成濾波器和本地?cái)?shù)據(jù)庫(kù);所述合成濾波器信號(hào)連接于數(shù)據(jù)發(fā)送裝置;所述本地?cái)?shù)據(jù)庫(kù)信號(hào)連接于數(shù)據(jù)接收裝置;所述數(shù)據(jù)發(fā)送裝置信號(hào)連接于移動(dòng)數(shù)據(jù)傳輸裝置;所述移動(dòng)數(shù)據(jù)傳輸裝置分別信號(hào)連接于處理器和云端數(shù)據(jù)傳輸裝置;所述處理器分別信號(hào)連接于控制器、語(yǔ)音識(shí)別裝置和顯示器;所述云端數(shù)據(jù)傳輸裝置分別信號(hào)連接于數(shù)據(jù)接收裝置數(shù)據(jù)接收裝置和云端數(shù)據(jù)庫(kù);所述云端數(shù)據(jù)庫(kù)信號(hào)連接于云端分析處理器。
[0035]所述聲音采集裝置包括:可轉(zhuǎn)向式麥克風(fēng)和強(qiáng)度識(shí)別系統(tǒng);所述強(qiáng)度識(shí)別裝置信號(hào)連接于可轉(zhuǎn)向式麥克風(fēng),用于識(shí)別出可轉(zhuǎn)向式麥克風(fēng)接收到聲音信號(hào)強(qiáng)度最強(qiáng)的方向,控制麥克風(fēng)轉(zhuǎn)向該方向;所述可轉(zhuǎn)向式麥克風(fēng),信號(hào)連接于信號(hào)轉(zhuǎn)換裝置,用于采集外部聲音信號(hào),根據(jù)聲音采集裝置發(fā)出的控制命令調(diào)整采集聲音信號(hào)的方向,以及將采集到的聲音信號(hào)發(fā)送至信號(hào)轉(zhuǎn)換裝置。
[0036]所述信號(hào)轉(zhuǎn)換裝置,用于將采集到的聲音信號(hào)從模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào);所述分解濾波器包括:分解器、偵測(cè)器;所述分解器,用于將接收到的信號(hào)分解成16個(gè)波段,進(jìn)行濾波處理后,再將16個(gè)波段的信號(hào)組成10組通道;所述偵測(cè)器包括多個(gè)偵測(cè)器組,每個(gè)偵測(cè)器組監(jiān)測(cè)一個(gè)通道的信號(hào)變化,每個(gè)偵測(cè)器組包含一個(gè)快速時(shí)間偵測(cè)器和慢速時(shí)間偵測(cè)器。
[0037]所述快速時(shí)間偵測(cè)器用于監(jiān)測(cè)變化較快的通道信號(hào),而慢速時(shí)間偵測(cè)器則偵測(cè)信號(hào)變化較慢的通道信號(hào),根據(jù)監(jiān)測(cè)結(jié)果,選用與通道信號(hào)變化相匹配的壓縮時(shí)間常數(shù)對(duì)信號(hào)進(jìn)行壓縮處理,或者選用與該通道信號(hào)變化相匹配的釋放時(shí)間常數(shù),對(duì)信號(hào)進(jìn)行釋放處理;將壓縮或釋放后的通道信號(hào)發(fā)送至增強(qiáng)系統(tǒng);所述增強(qiáng)系統(tǒng),用于增強(qiáng)所獲取的通道信號(hào)的強(qiáng)度,將增強(qiáng)后的通道信號(hào)發(fā)送至預(yù)處理計(jì)算裝置;所述預(yù)處理計(jì)算裝置包括:能量統(tǒng)計(jì)單元和增益計(jì)算單元;所述能量統(tǒng)計(jì)單元,用于統(tǒng)計(jì)接收到的通道信號(hào)的能量數(shù)據(jù),將統(tǒng)計(jì)到的能量數(shù)據(jù)和接收到的通道信號(hào)都發(fā)送至增益計(jì)算單元;所述增益計(jì)算單元,用于根據(jù)預(yù)設(shè)的增益計(jì)算方法,通過(guò)能量數(shù)據(jù)計(jì)算出用于信號(hào)識(shí)別分類(lèi)的數(shù)據(jù)信息,將接收到的通道信號(hào)和用于信號(hào)識(shí)別分類(lèi)的數(shù)據(jù)信息發(fā)送至判決系統(tǒng)。
[0038]所述判決系統(tǒng),包括分類(lèi)器、復(fù)合器、輔音判決器、聲調(diào)判決器和重音判決器;所述分類(lèi)器,用于根據(jù)預(yù)處理計(jì)算裝置發(fā)送過(guò)來(lái)的用于信號(hào)識(shí)別分類(lèi)的數(shù)據(jù)信息,將接收到的通道信號(hào)進(jìn)行分類(lèi)處理,將輔音類(lèi)通道信號(hào)發(fā)送至輔音判決器,將聲調(diào)類(lèi)信號(hào)發(fā)送至聲調(diào)判決器,將重音類(lèi)通道信號(hào)發(fā)送至重音判決器;所述輔音判決器,用于將接收到的輔音類(lèi)信號(hào)和本地?cái)?shù)據(jù)庫(kù)中的標(biāo)準(zhǔn)信號(hào)進(jìn)行比對(duì),得出準(zhǔn)確的輔音,將該輔音發(fā)送至復(fù)合器;所述聲調(diào)判決器,用于將接收到的聲調(diào)類(lèi)信號(hào)和本地?cái)?shù)據(jù)庫(kù)中的標(biāo)準(zhǔn)信號(hào)進(jìn)行比對(duì),得出準(zhǔn)確的聲調(diào),將該聲調(diào)發(fā)送至復(fù)合器;所述重音判決器,用于將接收到的重音類(lèi)信號(hào)和本地?cái)?shù)據(jù)庫(kù)中的標(biāo)準(zhǔn)信號(hào)進(jìn)行比對(duì),得出準(zhǔn)確的重音,將該重音發(fā)送至復(fù)合器;所述復(fù)合器,用于將接收到的輔音、聲調(diào)和重音進(jìn)行復(fù)合,生成完整的聲音信號(hào),將該聲音信號(hào)發(fā)送至合成濾波器。
[0039]所述合成濾波器,用于對(duì)接收到的聲音信號(hào)進(jìn)行平滑處理,和去除聲音信號(hào)中顯著的噪音信號(hào),將處理后的聲音信號(hào)發(fā)送至聽(tīng)筒和數(shù)據(jù)發(fā)送裝置;所述數(shù)據(jù)發(fā)送裝置,用于將處理后的聲音信號(hào)發(fā)送至移動(dòng)端數(shù)據(jù)傳輸裝置。
[0040]所述數(shù)據(jù)傳輸裝置將接收到的聲音信號(hào)經(jīng)處理器處理后發(fā)送至語(yǔ)音識(shí)別裝置,所述語(yǔ)音識(shí)別裝置用于將接收到的聲音信號(hào)進(jìn)行識(shí)別,轉(zhuǎn)換為文字,在顯示器中顯示出來(lái);所述控制器,用于人為根據(jù)文字信息和接收到的聲音信息,判斷識(shí)別端識(shí)別的聲音信號(hào)是否準(zhǔn)確,將判斷結(jié)果經(jīng)處理器處理后發(fā)送至云端。
[0041]所述云端分析處理器,用于將云端數(shù)據(jù)傳輸裝置接收到的數(shù)據(jù)信息進(jìn)行分析處理,統(tǒng)計(jì)分析出移動(dòng)端發(fā)送過(guò)來(lái)的識(shí)別不準(zhǔn)確的聲音信號(hào)發(fā)送至本地?cái)?shù)據(jù)庫(kù),覆蓋原有的標(biāo)準(zhǔn)信號(hào)。
[0042]所述增益計(jì)算方法包括以下步驟: 步驟I:設(shè)定獲取的信號(hào)能量數(shù)據(jù)為E(n);
步驟2:設(shè)定不同信號(hào)能量數(shù)據(jù)之間的關(guān)系為:E (n)= a E(n_l),其中:a是時(shí)間常數(shù)
,
步驟3:使用倒譜算法提取基頻;其中,倒譜算法中,采用512個(gè)點(diǎn)的快速傅里葉變換和窗移為1ms的40ms的漢明窗;
步驟4:用一個(gè)簡(jiǎn)單的滑動(dòng)平均算法對(duì)每個(gè)音節(jié)測(cè)到的基頻進(jìn)行平滑處理,剔除那些平滑段內(nèi)偏離均值過(guò)大的值;
步驟5:將音高和音長(zhǎng)分別進(jìn)行歸一化處理;
步驟6:采用一個(gè)二次曲線在最小均方誤差的意義下逼近基音軌跡。并計(jì)算曲線的一次斜率、二次斜率、谷點(diǎn)和平坦度。
[0043]本發(fā)明實(shí)施例3中提供了一種基于智能化語(yǔ)音識(shí)別技術(shù)的助聽(tīng)器系統(tǒng),系統(tǒng)結(jié)構(gòu)圖如圖1所示:
一種基于語(yǔ)音識(shí)別技術(shù)的助聽(tīng)器系統(tǒng),其特征在于,所述系統(tǒng)包括:識(shí)別端、移動(dòng)端和云端;所述識(shí)別端包括:聲音采集裝置、信號(hào)轉(zhuǎn)換裝置、分解濾波器、增強(qiáng)系統(tǒng)、預(yù)處理計(jì)算裝置、判決系統(tǒng)、合成濾波器、數(shù)據(jù)發(fā)送裝置、本地?cái)?shù)據(jù)庫(kù)和數(shù)據(jù)接收裝置;所述移動(dòng)端包括:控制器、處理器、顯示器、語(yǔ)音識(shí)別裝置和移動(dòng)數(shù)據(jù)傳輸裝置;所述云端包括:云端數(shù)據(jù)傳輸裝置、云端數(shù)據(jù)庫(kù)和云端分析處理器;
所述聲音采集裝置信號(hào)連接于信號(hào)轉(zhuǎn)換裝置;所述信號(hào)轉(zhuǎn)換裝置信號(hào)連接于分解濾波器;所述分解濾波器信號(hào)連接于增強(qiáng)系統(tǒng);所述增強(qiáng)系統(tǒng)信號(hào)連接于預(yù)處理計(jì)算裝置、所述預(yù)處理計(jì)算裝置信號(hào)連接于判決系統(tǒng);所述判決系統(tǒng)分別信號(hào)連接于合成濾波器和本地?cái)?shù)據(jù)庫(kù);所述合成濾波器信號(hào)連接于數(shù)據(jù)發(fā)送裝置;所述本地?cái)?shù)據(jù)庫(kù)信號(hào)連接于數(shù)據(jù)接收裝置;所述數(shù)據(jù)發(fā)送裝置信號(hào)連接于移動(dòng)數(shù)據(jù)傳輸裝置;所述移動(dòng)數(shù)據(jù)傳輸裝置分別信號(hào)連接于處理器和云端數(shù)據(jù)傳輸裝置;所述處理器分別信號(hào)連接于控制器、語(yǔ)音識(shí)別裝置和顯示器;所述云端數(shù)據(jù)傳輸裝置分別信號(hào)連接于數(shù)據(jù)接收裝置數(shù)據(jù)接收裝置和云端數(shù)據(jù)庫(kù);所述云端數(shù)據(jù)庫(kù)信號(hào)連接于云端分析處理器。
[0044]所述聲音采集裝置包括:可轉(zhuǎn)向式麥克風(fēng)和強(qiáng)度識(shí)別系統(tǒng);所述強(qiáng)度識(shí)別裝置信號(hào)連接于可轉(zhuǎn)向式麥克風(fēng),用于識(shí)別出可轉(zhuǎn)向式麥克風(fēng)接收到聲音信號(hào)強(qiáng)度最強(qiáng)的方向,控制麥克風(fēng)轉(zhuǎn)向該方向;所述可轉(zhuǎn)向式麥克風(fēng),信號(hào)連接于信號(hào)轉(zhuǎn)換裝置,用于采集外部聲音信號(hào),根據(jù)聲音采集裝置發(fā)出的控制命令調(diào)整采集聲音信號(hào)的方向,以及將采集到的聲音信號(hào)發(fā)送至信號(hào)轉(zhuǎn)換裝置。
[0045]所述信號(hào)轉(zhuǎn)換裝置,用于將采集到的聲音信號(hào)從模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào);所述分解濾波器包括:分解器、偵測(cè)器;所述分解器,用于將接收到的信號(hào)分解成16個(gè)波段,進(jìn)行濾波處理后,再將16個(gè)波段的信號(hào)組成10組通道;所述偵測(cè)器包括多個(gè)偵測(cè)器組,每個(gè)偵測(cè)器組監(jiān)測(cè)一個(gè)通道的信號(hào)變化,每個(gè)偵測(cè)器組包含一個(gè)快速時(shí)間偵測(cè)器和慢速時(shí)間偵測(cè)器。
[0046]所述快速時(shí)間偵測(cè)器用于監(jiān)測(cè)變化較快的通道信號(hào),而慢速時(shí)間偵測(cè)器則偵測(cè)信號(hào)變化較慢的通道信號(hào),根據(jù)監(jiān)測(cè)結(jié)果,選用與通道信號(hào)變化相匹配的壓縮時(shí)間常數(shù)對(duì)信號(hào)進(jìn)行壓縮處理,或者選用與該通道信號(hào)變化相匹配的釋放時(shí)間常數(shù),對(duì)信號(hào)進(jìn)行釋放處理;將壓縮或釋放后的通道信號(hào)發(fā)送至增強(qiáng)系統(tǒng);所述增強(qiáng)系統(tǒng),用于增強(qiáng)所獲取的通道信號(hào)的強(qiáng)度,將增強(qiáng)后的通道信號(hào)發(fā)送至預(yù)處理計(jì)算裝置;所述預(yù)處理計(jì)算裝置包括:能量統(tǒng)計(jì)單元和增益計(jì)算單元;所述能量統(tǒng)計(jì)單元,用于統(tǒng)計(jì)接收到的通道信號(hào)的能量數(shù)據(jù),將統(tǒng)計(jì)到的能量數(shù)據(jù)和接收到的通道信號(hào)都發(fā)送至增益計(jì)算單元;所述增益計(jì)算單元,用于根據(jù)預(yù)設(shè)的增益計(jì)算方法,通過(guò)能量數(shù)據(jù)計(jì)算出用于信號(hào)識(shí)別分類(lèi)的數(shù)據(jù)信息,將接收到的通道信號(hào)和用于信號(hào)識(shí)別分類(lèi)的數(shù)據(jù)信息發(fā)送至判決系統(tǒng)。
[0047]所述判決系統(tǒng),包括分類(lèi)器、復(fù)合器、輔音判決器、聲調(diào)判決器和重音判決器;所述分類(lèi)器,用于根據(jù)預(yù)處理計(jì)算裝置發(fā)送過(guò)來(lái)的用于信號(hào)識(shí)別分類(lèi)的數(shù)據(jù)信息,將接收到的通道信號(hào)進(jìn)行分類(lèi)處理,將輔音類(lèi)通道信號(hào)發(fā)送至輔音判決器,將聲調(diào)類(lèi)信號(hào)發(fā)送至聲調(diào)判決器,將重音類(lèi)通道信號(hào)發(fā)送至重音判決器;所述輔音判決器,用于將接收到的輔音類(lèi)信號(hào)和本地?cái)?shù)據(jù)庫(kù)中的標(biāo)準(zhǔn)信號(hào)進(jìn)行比對(duì),得出準(zhǔn)確的輔音,將該輔音發(fā)送至復(fù)合器;所述聲調(diào)判決器,用于將接收到的聲調(diào)類(lèi)信號(hào)和本地?cái)?shù)據(jù)庫(kù)中的標(biāo)準(zhǔn)信號(hào)進(jìn)行比對(duì),得出準(zhǔn)確的聲調(diào),將該聲調(diào)發(fā)送至復(fù)合器;所述重音判決器,用于將接收到的重音類(lèi)信號(hào)和本地?cái)?shù)據(jù)庫(kù)中的標(biāo)準(zhǔn)信號(hào)進(jìn)行比對(duì),得出準(zhǔn)確的重音,將該重音發(fā)送至復(fù)合器;所述復(fù)合器,用于將接收到的輔音、聲調(diào)和重音進(jìn)行復(fù)合,生成完整的聲音信號(hào),將該聲音信號(hào)發(fā)送至合成濾波器。
[0048]所述合成濾波器,用于對(duì)接收到的聲音信號(hào)進(jìn)行平滑處理,和去除聲音信號(hào)中顯著的噪音信號(hào),將處理后的聲音信號(hào)發(fā)送至聽(tīng)筒和數(shù)據(jù)發(fā)送裝置;所述數(shù)據(jù)發(fā)送裝置,用于將處理后的聲音信號(hào)發(fā)送至移動(dòng)端數(shù)據(jù)傳輸裝置。
[0049]所述數(shù)據(jù)傳輸裝置將接收到的聲音信號(hào)經(jīng)處理器處理后發(fā)送至語(yǔ)音識(shí)別裝置,所述語(yǔ)音識(shí)別裝置用于將接收到的聲音信號(hào)進(jìn)行識(shí)別,轉(zhuǎn)換為文字,在顯示器中顯示出來(lái);所述控制器,用于人為根據(jù)文字信息和接收到的聲音信息,判斷識(shí)別端識(shí)別的聲音信號(hào)是否準(zhǔn)確,將判斷結(jié)果經(jīng)處理器處理后發(fā)送至云端。
[0050]所述云端分析處理器,用于將云端數(shù)據(jù)傳輸裝置接收到的數(shù)據(jù)信息進(jìn)行分析處理,統(tǒng)計(jì)分析出移動(dòng)端發(fā)送過(guò)來(lái)的識(shí)別不準(zhǔn)確的聲音信號(hào)發(fā)送至本地?cái)?shù)據(jù)庫(kù),覆蓋原有的標(biāo)準(zhǔn)信號(hào)。
[0051]所述增益計(jì)算方法包括以下步驟:
步驟I:設(shè)定獲取的信號(hào)能量數(shù)據(jù)為E(n);
步驟2:設(shè)定不同信號(hào)能量數(shù)據(jù)之間的關(guān)系為:E (n)= a E(n_l),其中:a是時(shí)間常數(shù)
,
步驟3:使用倒譜算法提取基頻;其中,倒譜算法中,采用512個(gè)點(diǎn)的快速傅里葉變換和窗移為1ms的40ms的漢明窗;
步驟4:用一個(gè)簡(jiǎn)單的滑動(dòng)平均算法對(duì)每個(gè)音節(jié)測(cè)到的基頻進(jìn)行平滑處理,剔除那些平滑段內(nèi)偏離均值過(guò)大的值;
步驟5:將音高和音長(zhǎng)分別進(jìn)行歸一化處理;
步驟6:采用一個(gè)二次曲線在最小均方誤差的意義下逼近基音軌跡。并計(jì)算曲線的一次斜率、二次斜率、谷點(diǎn)和平坦度。
[0052]該系統(tǒng)提供獨(dú)特的方向控制方法,準(zhǔn)確控制話筒方向,使得搜集到的語(yǔ)音信號(hào)更加清晰和準(zhǔn)確;同時(shí),將中文語(yǔ)音進(jìn)行分解、濾波、能量增強(qiáng)等處理。將中文語(yǔ)音分解為輔音、重音和聲調(diào)后進(jìn)行處理。可以最大程度上增強(qiáng)中文語(yǔ)音是別的準(zhǔn)確性。
[0053]本系統(tǒng)采用的移動(dòng)端判斷語(yǔ)音和云端大數(shù)據(jù)分析等手段,可以針對(duì)識(shí)別結(jié)果進(jìn)行自主判斷,進(jìn)而進(jìn)行大數(shù)據(jù)統(tǒng)計(jì)分析處理,發(fā)現(xiàn)是被過(guò)程中誤判率較高的音調(diào)和聲調(diào),再將本地?cái)?shù)據(jù)庫(kù)中的標(biāo)準(zhǔn)信號(hào)進(jìn)行替換,使得下一次遇到該聲調(diào)和音調(diào)后不再出現(xiàn)誤判。
[0054]自主研發(fā)的中文語(yǔ)音識(shí)別算法,能夠適應(yīng)復(fù)雜情景的語(yǔ)音識(shí)別,將信號(hào)能量作為語(yǔ)音識(shí)別中的重要要素,可以刨除其他因素的影響。
[0055]產(chǎn)品出售后,針對(duì)用戶(hù)的反饋,可以進(jìn)行大數(shù)據(jù)分析,針對(duì)分析結(jié)果,可以不斷調(diào)整算法和處理方法,優(yōu)化產(chǎn)品,提供產(chǎn)品升級(jí)等處理方案。
[0056]本發(fā)明并不局限于前述的【具體實(shí)施方式】。本發(fā)明擴(kuò)展到任何在本說(shuō)明書(shū)中披露的新特征或任何新的組合,以及披露的任一新的方法或過(guò)程的步驟或任何新的組合。
【主權(quán)項(xiàng)】
1.一種基于語(yǔ)音識(shí)別技術(shù)的助聽(tīng)器系統(tǒng),其特征在于,所述系統(tǒng)包括:識(shí)別端、移動(dòng)端和云端;所述識(shí)別端包括:聲音采集裝置、信號(hào)轉(zhuǎn)換裝置、分解濾波器、增強(qiáng)系統(tǒng)、預(yù)處理計(jì)算裝置、判決系統(tǒng)、合成濾波器、數(shù)據(jù)發(fā)送裝置、本地?cái)?shù)據(jù)庫(kù)和數(shù)據(jù)接收裝置;所述移動(dòng)端包括:控制器、處理器、顯示器、語(yǔ)音識(shí)別裝置和移動(dòng)數(shù)據(jù)傳輸裝置;所述云端包括:云端數(shù)據(jù)傳輸裝置、云端數(shù)據(jù)庫(kù)和云端分析處理器; 所述聲音采集裝置信號(hào)連接于信號(hào)轉(zhuǎn)換裝置;所述信號(hào)轉(zhuǎn)換裝置信號(hào)連接于分解濾波器;所述分解濾波器信號(hào)連接于增強(qiáng)系統(tǒng);所述增強(qiáng)系統(tǒng)信號(hào)連接于預(yù)處理計(jì)算裝置、所述預(yù)處理計(jì)算裝置信號(hào)連接于判決系統(tǒng);所述判決系統(tǒng)分別信號(hào)連接于合成濾波器和本地?cái)?shù)據(jù)庫(kù);所述合成濾波器信號(hào)連接于數(shù)據(jù)發(fā)送裝置;所述本地?cái)?shù)據(jù)庫(kù)信號(hào)連接于數(shù)據(jù)接收裝置;所述數(shù)據(jù)發(fā)送裝置信號(hào)連接于移動(dòng)數(shù)據(jù)傳輸裝置;所述移動(dòng)數(shù)據(jù)傳輸裝置分別信號(hào)連接于處理器和云端數(shù)據(jù)傳輸裝置;所述處理器分別信號(hào)連接于控制器、語(yǔ)音識(shí)別裝置和顯示器;所述云端數(shù)據(jù)傳輸裝置分別信號(hào)連接于數(shù)據(jù)接收裝置數(shù)據(jù)接收裝置和云端數(shù)據(jù)庫(kù);所述云端數(shù)據(jù)庫(kù)信號(hào)連接于云端分析處理器。2.如權(quán)利要求1所述的基于語(yǔ)音識(shí)別技術(shù)的助聽(tīng)器系統(tǒng),其特征在于,所述聲音采集裝置包括:可轉(zhuǎn)向式麥克風(fēng)和強(qiáng)度識(shí)別系統(tǒng);所述強(qiáng)度識(shí)別裝置信號(hào)連接于可轉(zhuǎn)向式麥克風(fēng),用于識(shí)別出可轉(zhuǎn)向式麥克風(fēng)接收到聲音信號(hào)強(qiáng)度最強(qiáng)的方向,控制麥克風(fēng)轉(zhuǎn)向該方向;所述可轉(zhuǎn)向式麥克風(fēng),信號(hào)連接于信號(hào)轉(zhuǎn)換裝置,用于采集外部聲音信號(hào),根據(jù)聲音采集裝置發(fā)出的控制命令調(diào)整采集聲音信號(hào)的方向,以及將采集到的聲音信號(hào)發(fā)送至信號(hào)轉(zhuǎn)換裝置。3.如權(quán)利要求1或2所述的基于語(yǔ)音識(shí)別技術(shù)的助聽(tīng)器系統(tǒng),其特征在于,所述信號(hào)轉(zhuǎn)換裝置,用于將采集到的聲音信號(hào)從模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào);所述分解濾波器包括:分解器、偵測(cè)器;所述分解器,用于將接收到的信號(hào)分解成16個(gè)波段,進(jìn)行濾波處理后,再將16個(gè)波段的信號(hào)組成10組通道;所述偵測(cè)器包括多個(gè)偵測(cè)器組,每個(gè)偵測(cè)器組監(jiān)測(cè)一個(gè)通道的信號(hào)變化,每個(gè)偵測(cè)器組包含一個(gè)快速時(shí)間偵測(cè)器和慢速時(shí)間偵測(cè)器。4.如權(quán)利要求3所述的基于語(yǔ)音識(shí)別技術(shù)的助聽(tīng)器系統(tǒng),其特征在于,所述快速時(shí)間偵測(cè)器用于監(jiān)測(cè)變化較快的通道信號(hào),而慢速時(shí)間偵測(cè)器則偵測(cè)信號(hào)變化較慢的通道信號(hào),根據(jù)監(jiān)測(cè)結(jié)果,選用與通道信號(hào)變化相匹配的壓縮時(shí)間常數(shù)對(duì)信號(hào)進(jìn)行壓縮處理,或者選用與該通道信號(hào)變化相匹配的釋放時(shí)間常數(shù),對(duì)信號(hào)進(jìn)行釋放處理;將壓縮或釋放后的通道信號(hào)發(fā)送至增強(qiáng)系統(tǒng);所述增強(qiáng)系統(tǒng),用于增強(qiáng)所獲取的通道信號(hào)的強(qiáng)度,將增強(qiáng)后的通道信號(hào)發(fā)送至預(yù)處理計(jì)算裝置;所述預(yù)處理計(jì)算裝置包括:能量統(tǒng)計(jì)單元和增益計(jì)算單元;所述能量統(tǒng)計(jì)單元,用于統(tǒng)計(jì)接收到的通道信號(hào)的能量數(shù)據(jù),將統(tǒng)計(jì)到的能量數(shù)據(jù)和接收到的通道信號(hào)都發(fā)送至增益計(jì)算單元;所述增益計(jì)算單元,用于根據(jù)預(yù)設(shè)的增益計(jì)算方法,通過(guò)能量數(shù)據(jù)計(jì)算出用于信號(hào)識(shí)別分類(lèi)的數(shù)據(jù)信息,將接收到的通道信號(hào)和用于信號(hào)識(shí)別分類(lèi)的數(shù)據(jù)信息發(fā)送至判決系統(tǒng)。5.如權(quán)利要求4所述的基于語(yǔ)音識(shí)別技術(shù)的助聽(tīng)器系統(tǒng),其特征在于,所述判決系統(tǒng),包括分類(lèi)器、復(fù)合器、輔音判決器、聲調(diào)判決器和重音判決器;所述分類(lèi)器,用于根據(jù)預(yù)處理計(jì)算裝置發(fā)送過(guò)來(lái)的用于信號(hào)識(shí)別分類(lèi)的數(shù)據(jù)信息,將接收到的通道信號(hào)進(jìn)行分類(lèi)處理,將輔音類(lèi)通道信號(hào)發(fā)送至輔音判決器,將聲調(diào)類(lèi)信號(hào)發(fā)送至聲調(diào)判決器,將重音類(lèi)通道信號(hào)發(fā)送至重音判決器;所述輔音判決器,用于將接收到的輔音類(lèi)信號(hào)和本地?cái)?shù)據(jù)庫(kù)中的標(biāo)準(zhǔn)信號(hào)進(jìn)行比對(duì),得出準(zhǔn)確的輔音,將該輔音發(fā)送至復(fù)合器;所述聲調(diào)判決器,用于將接收到的聲調(diào)類(lèi)信號(hào)和本地?cái)?shù)據(jù)庫(kù)中的標(biāo)準(zhǔn)信號(hào)進(jìn)行比對(duì),得出準(zhǔn)確的聲調(diào),將該聲調(diào)發(fā)送至復(fù)合器;所述重音判決器,用于將接收到的重音類(lèi)信號(hào)和本地?cái)?shù)據(jù)庫(kù)中的標(biāo)準(zhǔn)信號(hào)進(jìn)行比對(duì),得出準(zhǔn)確的重音,將該重音發(fā)送至復(fù)合器;所述復(fù)合器,用于將接收到的輔音、聲調(diào)和重音進(jìn)行復(fù)合,生成完整的聲音信號(hào),將該聲音信號(hào)發(fā)送至合成濾波器。6.如權(quán)利要求4所述的基于語(yǔ)音識(shí)別技術(shù)的助聽(tīng)器系統(tǒng),其特征在于,所述合成濾波器,用于對(duì)接收到的聲音信號(hào)進(jìn)行平滑處理,和去除聲音信號(hào)中顯著的噪音信號(hào),將處理后的聲音信號(hào)發(fā)送至聽(tīng)筒和數(shù)據(jù)發(fā)送裝置;所述數(shù)據(jù)發(fā)送裝置,用于將處理后的聲音信號(hào)發(fā)送至移動(dòng)端數(shù)據(jù)傳輸裝置。7.如權(quán)利要求6所述的基于語(yǔ)音識(shí)別技術(shù)的助聽(tīng)器系統(tǒng),其特征在于,所述數(shù)據(jù)傳輸裝置將接收到的聲音信號(hào)經(jīng)處理器處理后發(fā)送至語(yǔ)音識(shí)別裝置,所述語(yǔ)音識(shí)別裝置用于將接收到的聲音信號(hào)進(jìn)行識(shí)別,轉(zhuǎn)換為文字,在顯示器中顯示出來(lái);所述控制器,用于人為根據(jù)文字信息和接收到的聲音信息,判斷識(shí)別端識(shí)別的聲音信號(hào)是否準(zhǔn)確,將判斷結(jié)果經(jīng)處理器處理后發(fā)送至云端。8.如權(quán)利要求7所述的基于語(yǔ)音識(shí)別技術(shù)的助聽(tīng)器系統(tǒng),其特征在于,所述云端分析處理器,用于將云端數(shù)據(jù)傳輸裝置接收到的數(shù)據(jù)信息進(jìn)行分析處理,統(tǒng)計(jì)分析出移動(dòng)端發(fā)送過(guò)來(lái)的識(shí)別不準(zhǔn)確的聲音信號(hào)發(fā)送至本地?cái)?shù)據(jù)庫(kù),覆蓋原有的標(biāo)準(zhǔn)信號(hào)。9.如權(quán)利要求4所述的基于語(yǔ)音識(shí)別技術(shù)的助聽(tīng)器系統(tǒng),其特征在于,所述增益計(jì)算方法包括以下步驟: 步驟I:設(shè)定獲取的信號(hào)能量數(shù)據(jù)為E(n); 步驟2:設(shè)定不同信號(hào)能量數(shù)據(jù)之間的關(guān)系為:E (n)= a E(n_l),其中:a是時(shí)間常數(shù), 步驟3:使用倒譜算法提取基頻;其中,倒譜算法中,采用512個(gè)點(diǎn)的快速傅里葉變換和窗移為1ms的40ms的漢明窗; 步驟4:用一個(gè)簡(jiǎn)單的滑動(dòng)平均算法對(duì)每個(gè)音節(jié)測(cè)到的基頻進(jìn)行平滑處理,剔除那些平滑段內(nèi)偏離均值過(guò)大的值; 步驟5:將音高和音長(zhǎng)分別進(jìn)行歸一化處理; 步驟6:采用一個(gè)二次曲線在最小均方誤差的意義下逼近基音軌跡;并計(jì)算曲線的一次斜率、二次斜率、谷點(diǎn)和平坦度。
【文檔編號(hào)】H04R25/00GK105916090SQ201610376244
【公開(kāi)日】2016年8月31日
【申請(qǐng)日】2016年5月31日
【發(fā)明人】曾麗
【申請(qǐng)人】成都九十度工業(yè)產(chǎn)品設(shè)計(jì)有限公司