本申請涉及語音識別技術(shù)領(lǐng)域,尤其涉及一種基于人工智能的語音喚醒方法、裝置和計(jì)算機(jī)設(shè)備。
背景技術(shù):
在智能家居或者語音交互系統(tǒng)中,語音喚醒(wakeword)技術(shù)應(yīng)用非常廣泛。但是語音喚醒的效果和運(yùn)算量大大地降低了語音喚醒的實(shí)際應(yīng)用體驗(yàn),提高了語音喚醒對設(shè)備硬件的要求,例如:如果語音喚醒的誤喚醒率在應(yīng)用中大于一個(gè)閾值,如1個(gè)/3小時(shí),這樣的喚醒誤觸發(fā)頻率就有可能引起用戶的反感;另一方面,如果語音喚醒的運(yùn)算量超出了一些低端芯片的運(yùn)算能力,就會制約很多產(chǎn)品使用語音喚醒技術(shù)。
現(xiàn)有的相關(guān)技術(shù)中,語音喚醒使用的技術(shù)是關(guān)鍵詞識別(keyword-spotting)方法,通過設(shè)計(jì)一個(gè)小的深度神經(jīng)網(wǎng)絡(luò)(deepneuralnetworks;以下簡稱:dnn)的模型,搭建一個(gè)巧妙的小解碼網(wǎng)絡(luò),配合一些關(guān)鍵詞檢出的小技巧(trick),實(shí)現(xiàn)語音喚醒功能。
但是,上述關(guān)鍵詞識別方法的語音喚醒技術(shù),模型參數(shù)量較大,而且針對不同的喚醒詞,填充詞(filler)的設(shè)計(jì)均要改變,相應(yīng)的解碼參數(shù)和檢出的trick都要進(jìn)行調(diào)整,很難有一個(gè)統(tǒng)一的算法來確保每一個(gè)喚醒詞的效果處于一個(gè)穩(wěn)定的水平,而且這種設(shè)定好filler之后,喚醒詞的誤識水平就固定了,并不能夠靈活方便的對誤識的喚醒詞進(jìn)行調(diào)整和學(xué)習(xí)。
技術(shù)實(shí)現(xiàn)要素:
本申請的目的旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。
為此,本申請的第一個(gè)目的在于提出一種基于人工智能的語音喚醒方法。該方法可以有效地降低基于卷積神經(jīng)網(wǎng)絡(luò)的語音喚醒模型的參數(shù)量,從而達(dá)到降低運(yùn)算量的目的,另外該方法通過使用后驗(yàn)概率的策略,可以使得運(yùn)算量進(jìn)一步減??;并且該方法針對喚醒詞和非喚醒詞有更好的區(qū)分度,可以提升語音喚醒的效果。
本申請的第二個(gè)目的在于提出一種基于人工智能的語音喚醒裝置。
本申請的第三個(gè)目的在于提出一種計(jì)算機(jī)設(shè)備。
本申請的第四個(gè)目的在于提出一種計(jì)算機(jī)可讀存儲介質(zhì)。
為了實(shí)現(xiàn)上述目的,本申請第一方面實(shí)施例的基于人工智能的語音喚醒方法,包括:對在線錄制的語音進(jìn)行加窗分幀操作,獲得至少一個(gè)語音幀;對所述語音幀進(jìn)行特征提取,獲得語音特征;通過基于卷積神經(jīng)網(wǎng)絡(luò)的語音喚醒模型對所述語音幀包含的靜態(tài)的語音特征進(jìn)行計(jì)算,獲得所述語音幀包含的靜態(tài)的語音特征對應(yīng)于非喚醒詞類別和喚醒詞類別的后驗(yàn)概率;當(dāng)所述語音幀包含的靜態(tài)的語音特征對應(yīng)于喚醒詞類別的后驗(yàn)概率大于或等于預(yù)定閾值時(shí),確定所述在線錄制的語音中包括喚醒詞。
本申請實(shí)施例的基于人工智能的語音喚醒方法中,對在線錄制的語音進(jìn)行加窗分幀操作,獲得至少一個(gè)語音幀之后,對上述語音幀進(jìn)行特征提取,獲得語音特征,然后通過基于卷積神經(jīng)網(wǎng)絡(luò)的語音喚醒模型對上述語音幀包含的靜態(tài)的語音特征進(jìn)行計(jì)算,獲得上述語音幀包含的靜態(tài)的語音特征對應(yīng)于非喚醒詞類別和喚醒詞類別的后驗(yàn)概率,當(dāng)上述語音幀包含的靜態(tài)的語音特征對應(yīng)于喚醒詞類別的后驗(yàn)概率大于或等于預(yù)定閾值時(shí),確定在線錄制的語音中包括喚醒詞,上述基于卷積神經(jīng)網(wǎng)絡(luò)的語音喚醒模型的輸入特征較少,從而可以達(dá)到降低運(yùn)算量的目的,另外該方法通過使用后驗(yàn)概率的策略,使得運(yùn)算量進(jìn)一步減小;并且該方法針對喚醒詞和非喚醒詞有更好的區(qū)分度,可以提升語音喚醒的效果;另外,該方法不需要針對每一個(gè)喚醒詞挑選不同的非喚醒詞,提高了該方法的通用性。
為了實(shí)現(xiàn)上述目的,本申請第二方面實(shí)施例的基于人工智能的語音喚醒裝置,包括:分幀模塊,用于對在線錄制的語音進(jìn)行加窗分幀操作,獲得至少一個(gè)語音幀;提取模塊,用于對所述分幀模塊獲得的語音幀進(jìn)行特征提取,獲得語音特征;計(jì)算模塊,用于通過基于卷積神經(jīng)網(wǎng)絡(luò)的語音喚醒模型對所述語音幀包含的靜態(tài)的語音特征進(jìn)行計(jì)算,獲得所述語音幀包含的靜態(tài)的語音特征對應(yīng)于非喚醒詞類別和喚醒詞類別的后驗(yàn)概率;喚醒模塊,用于當(dāng)所述計(jì)算模塊獲得的所述語音幀包含的靜態(tài)的語音特征對應(yīng)于喚醒詞類別的后驗(yàn)概率大于或等于預(yù)定閾值時(shí),確定所述在線錄制的語音中包括喚醒詞。
本申請實(shí)施例的基于人工智能的語音喚醒裝置中,分幀模塊對在線錄制的語音進(jìn)行加窗分幀操作,獲得至少一個(gè)語音幀之后,提取模塊對上述語音幀進(jìn)行特征提取,獲得語音特征,然后計(jì)算模塊通過基于卷積神經(jīng)網(wǎng)絡(luò)的語音喚醒模型對上述語音幀包含的靜態(tài)的語音特征進(jìn)行計(jì)算,獲得上述語音幀包含的靜態(tài)的語音特征對應(yīng)于非喚醒詞類別和喚醒詞類別的后驗(yàn)概率,當(dāng)上述語音幀包含的靜態(tài)的語音特征對應(yīng)于喚醒詞類別的后驗(yàn)概率大于或等于預(yù)定閾值時(shí),確定模塊確定在線錄制的語音中包括喚醒詞,上述基于卷積神經(jīng)網(wǎng)絡(luò)的語音喚醒模型的輸入特征較少,從而可以達(dá)到降低運(yùn)算量的目的,另外該裝置通過使用后驗(yàn)概率的策略,使得運(yùn)算量進(jìn)一步減??;并且該裝置針對喚醒詞和非喚醒詞有更好的區(qū)分度,可以提升語音喚醒的效果;另外,該裝置不需要針對每一個(gè)喚醒詞挑選不同的非喚醒詞,提高了該裝置的通用性。
為了實(shí)現(xiàn)上述目的,本申請第三方面實(shí)施例的計(jì)算機(jī)設(shè)備,包括:一個(gè)或多個(gè)處理器;存儲裝置,用于存儲一個(gè)或多個(gè)程序,當(dāng)所述一個(gè)或多個(gè)程序被所述一個(gè)或多個(gè)處理器執(zhí)行,使得所述一個(gè)或多個(gè)處理器實(shí)現(xiàn)如上所述的方法。
為了實(shí)現(xiàn)上述目的,本申請第四方面實(shí)施例的計(jì)算機(jī)可讀介質(zhì),其上存儲有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上所述的方法。
本申請附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本申請的實(shí)踐了解到。
附圖說明
本申請上述的和/或附加的方面和優(yōu)點(diǎn)從下面結(jié)合附圖對實(shí)施例的描述中將變得明顯和容易理解,其中:
圖1為本申請基于人工智能的語音喚醒方法一個(gè)實(shí)施例的流程圖;
圖2為本申請基于人工智能的語音喚醒方法另一個(gè)實(shí)施例的流程圖;
圖3為本申請基于人工智能的語音喚醒方法再一個(gè)實(shí)施例的流程圖;
圖4為本申請基于人工智能的語音喚醒方法再一個(gè)實(shí)施例的流程圖;
圖5為本申請基于人工智能的語音喚醒方法再一個(gè)實(shí)施例的流程圖;
圖6為本申請基于人工智能的語音喚醒裝置一個(gè)實(shí)施例的結(jié)構(gòu)示意圖;
圖7為本申請基于人工智能的語音喚醒裝置另一個(gè)實(shí)施例的結(jié)構(gòu)示意圖;
圖8為本申請計(jì)算機(jī)設(shè)備一個(gè)實(shí)施例的結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面詳細(xì)描述本申請的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實(shí)施例是示例性的,僅用于解釋本申請,而不能理解為對本申請的限制。相反,本申請的實(shí)施例包括落入所附加權(quán)利要求書的精神和內(nèi)涵范圍內(nèi)的所有變化、修改和等同物。
人工智能(artificialintelligence;以下簡稱:ai)是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。人工智能是計(jì)算機(jī)科學(xué)的一個(gè)分支,它企圖了解智能的實(shí)質(zhì),并生產(chǎn)出一種新的能以人類智能相似的方式做出反應(yīng)的智能機(jī)器,該領(lǐng)域的研究包括機(jī)器人、語言識別、圖像識別、自然語言處理和專家系統(tǒng)等。
圖1為本申請基于人工智能的語音喚醒方法一個(gè)實(shí)施例的流程圖,如圖1所示,上述基于人工智能的語音喚醒方法可以包括:
步驟101,對在線錄制的語音進(jìn)行加窗分幀操作,獲得至少一個(gè)語音幀。
具體地,在對在線錄制的語音進(jìn)行特征提取時(shí),需要先對上述語音進(jìn)行加窗分幀操作。舉例來說,窗長為25毫秒的語音,相鄰幀之間的幀移為10毫秒,也就是說,每10毫秒語音劃分為一個(gè)語音幀。
步驟102,對上述語音幀進(jìn)行特征提取,獲得語音特征。
具體地,在對在線錄制的語音進(jìn)行加窗分幀操作之后,就可以對獲得的語音幀進(jìn)行特征提取,獲得語音特征,本實(shí)施例中,上述語音特征可以為濾波器組(filterbank;以下簡稱:fbank)特征,也可以為其他的語音特征,例如梅爾頻率倒譜系數(shù)(melfrequencycepstrumcoefficient;以下簡稱:mfcc)特征,本實(shí)施例對此不作限定,但本實(shí)施例以上述語音特征為fbank特征為例進(jìn)行說明。
步驟103,通過基于卷積神經(jīng)網(wǎng)絡(luò)(convolutionalneuralnetwork;以下簡稱:cnn)的語音喚醒模型對上述語音幀包含的靜態(tài)的語音特征進(jìn)行計(jì)算,獲得上述語音幀包含的靜態(tài)的語音特征對應(yīng)于非喚醒詞類別和喚醒詞類別的后驗(yàn)概率。
本實(shí)施例中,上述語音幀包含的靜態(tài)的語音特征包括:當(dāng)前語音幀、上述當(dāng)前語音幀之前第一數(shù)量的語音幀和上述當(dāng)前語音幀之后第二數(shù)量的語音幀所包含的靜態(tài)的語音特征。
其中,上述第一數(shù)量和第二數(shù)量可以在具體實(shí)現(xiàn)時(shí),根據(jù)系統(tǒng)性能和/或?qū)崿F(xiàn)需求等自行設(shè)定,本實(shí)施例對上述第一數(shù)量和第二數(shù)量的大小不作限定,舉例來說,上述第一數(shù)量可以為23,上述第二數(shù)量可以為8。
具體地,上述基于cnn的語音喚醒模型可以為6層的cnn模型,為提高語音喚醒性能,上述基于cnn的語音喚醒模型使用連續(xù)多幀包含的靜態(tài)的fbank特征作為輸入,本實(shí)施例中,上述基于cnn的語音喚醒模型使用當(dāng)前語音幀、當(dāng)前語音幀之前的23個(gè)語音幀和當(dāng)前語音幀之后的8個(gè)語音幀所包含的靜態(tài)的fbank特征作為輸入。
本實(shí)施例中,基于cnn的語音喚醒模型的輸出至少包括兩個(gè)節(jié)點(diǎn),分別為非喚醒詞類別(即filler類別)和喚醒詞類別,對于輸入的上述語音幀包含的靜態(tài)的語音特征,基于cnn的語音喚醒模型經(jīng)過計(jì)算,可以輸出上述語音幀包含的靜態(tài)的語音特征對應(yīng)于非喚醒詞類別和喚醒詞類別的后驗(yàn)概率。
在具體實(shí)現(xiàn)時(shí),可以將上述喚醒詞類別再劃分為兩個(gè)類別,也就是說,基于cnn的語音喚醒模型的輸出可以包括三個(gè)節(jié)點(diǎn),一個(gè)非喚醒詞類別(即filler類別)和兩個(gè)喚醒詞類別,本實(shí)施例對基于cnn的語音喚醒模型的輸出中所包含的喚醒詞類別的個(gè)數(shù)不作限定。
步驟104,當(dāng)上述語音幀包含的靜態(tài)的語音特征對應(yīng)于喚醒詞類別的后驗(yàn)概率大于或等于預(yù)定閾值時(shí),確定上述在線錄制的語音中包括喚醒詞。
其中,上述預(yù)定閾值可以在具體實(shí)現(xiàn)時(shí),根據(jù)系統(tǒng)性能和/或?qū)崿F(xiàn)需求等自行設(shè)定,本實(shí)施例對上述預(yù)定閾值的大小不作限定,舉例來說,上述預(yù)定閾值可以為75%。
上述基于人工智能的語音喚醒方法中,對在線錄制的語音進(jìn)行加窗分幀操作,獲得至少一個(gè)語音幀之后,對上述語音幀進(jìn)行特征提取,獲得語音特征,然后通過基于卷積神經(jīng)網(wǎng)絡(luò)的語音喚醒模型對上述語音幀包含的靜態(tài)的語音特征進(jìn)行計(jì)算,獲得上述語音幀包含的靜態(tài)的語音特征對應(yīng)于非喚醒詞類別和喚醒詞類別的后驗(yàn)概率,當(dāng)上述語音幀包含的靜態(tài)的語音特征對應(yīng)于喚醒詞類別的后驗(yàn)概率大于或等于預(yù)定閾值時(shí),確定在線錄制的語音中包括喚醒詞,上述基于卷積神經(jīng)網(wǎng)絡(luò)的語音喚醒模型的輸入特征較少,從而可以達(dá)到降低運(yùn)算量的目的,另外該方法通過使用后驗(yàn)概率的策略,使得運(yùn)算量進(jìn)一步減??;并且該方法針對喚醒詞和非喚醒詞有更好的區(qū)分度,可以提升語音喚醒的效果;另外,該方法不需要針對每一個(gè)喚醒詞挑選不同的非喚醒詞,提高了該方法的通用性。
圖2為本申請基于人工智能的語音喚醒方法另一個(gè)實(shí)施例的流程圖,如圖2所示,步驟101之前,還可以包括:
步驟201,對用戶輸入的語音進(jìn)行在線錄制。
本實(shí)施例中,對于具有語音喚醒功能的設(shè)備來說,上述設(shè)備的錄音模塊一直對外部的聲音進(jìn)行在線錄制,以便在用戶輸入語音時(shí),對用戶輸入的語音進(jìn)行在線錄制,以觸發(fā)后續(xù)流程的執(zhí)行。
圖3為本申請基于人工智能的語音喚醒方法再一個(gè)實(shí)施例的流程圖,如圖3所示,步驟103之后,還可以包括:
步驟301,對預(yù)定數(shù)量的語音幀包含的靜態(tài)的語音特征對應(yīng)于非喚醒詞類別和喚醒詞類別的后驗(yàn)概率分別進(jìn)行累加,獲得預(yù)定數(shù)量的語音幀包含的靜態(tài)的語音特征對應(yīng)于非喚醒詞類別的后驗(yàn)概率,以及預(yù)定數(shù)量的語音幀包含的靜態(tài)的語音特征對應(yīng)于喚醒詞類別的后驗(yàn)概率。
這時(shí),步驟104中,上述語音幀包含的靜態(tài)的語音特征對應(yīng)于喚醒詞類別的后驗(yàn)概率大于或等于預(yù)定閾值可以為:預(yù)定數(shù)量的語音幀包含的靜態(tài)的語音特征對應(yīng)于喚醒詞類別的后驗(yàn)概率大于或等于預(yù)定閾值。
也就是說,步驟104可以為:
步驟302,當(dāng)預(yù)定數(shù)量的語音幀包含的靜態(tài)的語音特征對應(yīng)于喚醒詞類別的后驗(yàn)概率大于或等于預(yù)定閾值時(shí),確定上述在線錄制的語音中包括喚醒詞。
也就是說,本實(shí)施例在喚醒詞檢出上,采用固定窗長的平滑策略,對預(yù)定數(shù)量的語音幀包含的靜態(tài)的語音特征對應(yīng)于非喚醒詞類別和喚醒詞類別的后驗(yàn)概率分別進(jìn)行累加,當(dāng)預(yù)定數(shù)量的語音幀包含的靜態(tài)的語音特征對應(yīng)于喚醒詞類別的后驗(yàn)概率大于或等于預(yù)定閾值時(shí),即確定檢出喚醒詞,也就是確定上述在線錄制的語音中包括喚醒詞。
其中,上述預(yù)定數(shù)量可以在具體實(shí)現(xiàn)時(shí)根據(jù)系統(tǒng)性能和/或?qū)崿F(xiàn)需求自行設(shè)定,本實(shí)施例對上述預(yù)定數(shù)量的大小不作限定。
圖4為本申請基于人工智能的語音喚醒方法再一個(gè)實(shí)施例的流程圖,如圖4所示,步驟103之前,還包括:
步驟401,基于聯(lián)結(jié)主義時(shí)間分類器(connectionisttemporalclassifier;以下簡稱:ctc)的訓(xùn)練準(zhǔn)則對基于cnn的初始模型進(jìn)行訓(xùn)練,獲得上述基于cnn的語音喚醒模型。
本實(shí)施例中,對6層的cnn模型的訓(xùn)練準(zhǔn)則由交叉熵(crossentropy)變?yōu)閏tc,基于ctc的訓(xùn)練準(zhǔn)則對6層的基于cnn的初始模型進(jìn)行訓(xùn)練,可以獲得上述基于cnn的語音喚醒模型。
圖5為本申請基于人工智能的語音喚醒方法再一個(gè)實(shí)施例的流程圖,如圖5所示,本申請圖4所示實(shí)施例中,步驟401可以包括:
步驟501,利用訓(xùn)練數(shù)據(jù),基于ctc的訓(xùn)練準(zhǔn)則對基于cnn的初始模型進(jìn)行訓(xùn)練,獲得基于cnn的種子模型。
步驟502,通過測試數(shù)據(jù)對上述基于cnn的種子模型進(jìn)行測試,獲得上述基于cnn的種子模型誤識別的測試數(shù)據(jù)。
步驟503,通過上述誤識別的測試數(shù)據(jù)對上述基于cnn的種子模型進(jìn)行再次訓(xùn)練,直至上述基于cnn的種子模型在開發(fā)集上收斂,獲得上述基于cnn的語音喚醒模型。
具體地,通過上述誤識別的測試數(shù)據(jù)對上述基于cnn的種子模型進(jìn)行再次訓(xùn)練可以為:將上述基于cnn的種子模型誤識別的測試數(shù)據(jù)添加到步驟501中提到的訓(xùn)練數(shù)據(jù)中,然后再利用添加了這些測試數(shù)據(jù)的訓(xùn)練數(shù)據(jù),對上述基于cnn的種子模型進(jìn)行再次訓(xùn)練,重復(fù)步驟502與步驟503,直至上述基于cnn的種子模型在開發(fā)集上收斂,獲得上述基于cnn的語音喚醒模型。
其中,上述開發(fā)集是不同于步驟501中的訓(xùn)練數(shù)據(jù),也不同于步驟502中的測試數(shù)據(jù)的一個(gè)數(shù)據(jù)集,上述開發(fā)集用于對訓(xùn)練獲得的基于cnn的種子模型的喚醒性能進(jìn)行監(jiān)控,以獲得最終的基于cnn的語音喚醒模型;其中,上述基于cnn的種子模型在開發(fā)集上收斂,是指基于cnn的種子模型在開發(fā)集上的喚醒性能不再提高。
也就是說,利用添加了上述基于cnn的種子模型誤識別的測試數(shù)據(jù)的訓(xùn)練數(shù)據(jù),對上述基于cnn的種子模型進(jìn)行再次訓(xùn)練之后,在每一輪訓(xùn)練完成之后,在開發(fā)集上對本輪訓(xùn)練獲得的基于cnn的種子模型的喚醒性能進(jìn)行監(jiān)測,一般來說,基于cnn的種子模型在開發(fā)集上的喚醒性能是先下降,然后經(jīng)過多輪訓(xùn)練之后,基于cnn的種子模型在開發(fā)集上的喚醒性能會慢慢提高,直至基于cnn的種子模型在開發(fā)集上的喚醒性能不再提高,就可以確定上述基于cnn的種子模型在開發(fā)集上收斂,這時(shí)獲得的基于cnn的種子模型即為最終獲得的基于cnn的語音喚醒模型。
本申請實(shí)施例提供的基于人工智能的語音喚醒方法,通過使用cnn-ctc的方案,大大地縮小了基于cnn的語音喚醒模型的輸出層的節(jié)點(diǎn)數(shù),從而有效地降低了基于cnn的語音喚醒模型的參數(shù)量,達(dá)到降低運(yùn)算量的目的;通過使用后驗(yàn)概率平滑的策略,使得運(yùn)算量進(jìn)一步減??;另外,本申請實(shí)施例提供的基于人工智能的語音喚醒方法中使用一個(gè)非喚醒詞(filler)類別,增加了訓(xùn)練的靈活性,使得上述基于人工智能的語音喚醒方法非常的通用,不需要再針對每一個(gè)喚醒詞挑選不同的filler;本申請實(shí)施例提供的基于人工智能的語音喚醒方法中的基于cnn的語音喚醒模型通過自我學(xué)習(xí)調(diào)優(yōu)的方法,可以更好地提升語音喚醒的效果,另外,上述基于cnn的語音喚醒模型的輸出層簡單,目標(biāo)鮮明,針對喚醒詞和非喚醒詞有更好的區(qū)分度,可以進(jìn)一步提升語音喚醒的效果。
圖6為本申請基于人工智能的語音喚醒裝置一個(gè)實(shí)施例的結(jié)構(gòu)示意圖,本申請實(shí)施例中的基于人工智能的語音喚醒裝置可以作為具有語音喚醒功能的設(shè)備實(shí)現(xiàn)本申請實(shí)施例提供的基于人工智能的語音喚醒方法。如圖6所示,上述基于人工智能的語音喚醒裝置可以包括:分幀模塊61、提取模塊62、計(jì)算模塊63和喚醒模塊64;
其中,分幀模塊61,用于對在線錄制的語音進(jìn)行加窗分幀操作,獲得至少一個(gè)語音幀;具體地,在對在線錄制的語音進(jìn)行特征提取時(shí),分幀模塊61需要先對上述語音進(jìn)行加窗分幀操作。舉例來說,窗長為25毫秒的語音,相鄰幀之間的幀移為10毫秒,也就是說,每10毫秒語音劃分為一個(gè)語音幀。
提取模塊62,用于對分幀模塊61獲得的語音幀進(jìn)行特征提取,獲得語音特征;具體地,在分幀模塊61對在線錄制的語音進(jìn)行加窗分幀操作之后,提取模塊62就可以對獲得的語音幀進(jìn)行特征提取,獲得語音特征,本實(shí)施例中,上述語音特征可以為fbank特征,也可以為其他的語音特征,例如mfcc特征,本實(shí)施例對此不作限定,但本實(shí)施例以上述語音特征為fbank特征為例進(jìn)行說明。
計(jì)算模塊63,用于通過基于cnn的語音喚醒模型對上述語音幀包含的靜態(tài)的語音特征進(jìn)行計(jì)算,獲得上述語音幀包含的靜態(tài)的語音特征對應(yīng)于非喚醒詞類別和喚醒詞類別的后驗(yàn)概率;本實(shí)施例中,上述語音幀包含的靜態(tài)的語音特征包括:當(dāng)前語音幀、上述當(dāng)前語音幀之前第一數(shù)量的語音幀和上述當(dāng)前語音幀之后第二數(shù)量的語音幀所包含的靜態(tài)的語音特征。
其中,上述第一數(shù)量和第二數(shù)量可以在具體實(shí)現(xiàn)時(shí),根據(jù)系統(tǒng)性能和/或?qū)崿F(xiàn)需求等自行設(shè)定,本實(shí)施例對上述第一數(shù)量和第二數(shù)量的大小不作限定,舉例來說,上述第一數(shù)量可以為23,上述第二數(shù)量可以為8。
具體地,上述基于cnn的語音喚醒模型可以為6層的cnn模型,為提高語音喚醒性能,上述基于cnn的語音喚醒模型使用連續(xù)多幀包含的靜態(tài)的fbank特征作為輸入,本實(shí)施例中,上述基于cnn的語音喚醒模型使用當(dāng)前語音幀、當(dāng)前語音幀之前的23個(gè)語音幀和當(dāng)前語音幀之后的8個(gè)語音幀所包含的靜態(tài)的fbank特征作為輸入。
本實(shí)施例中,基于cnn的語音喚醒模型的輸出至少包括兩個(gè)節(jié)點(diǎn),分別為非喚醒詞類別(即filler類別)和喚醒詞類別,對于輸入的上述語音幀包含的靜態(tài)的語音特征,基于cnn的語音喚醒模型經(jīng)過計(jì)算,可以輸出上述語音幀包含的靜態(tài)的語音特征對應(yīng)于非喚醒詞類別和喚醒詞類別的后驗(yàn)概率。
在具體實(shí)現(xiàn)時(shí),可以將上述喚醒詞類別再劃分為兩個(gè)類別,也就是說,基于cnn的語音喚醒模型的輸出可以包括三個(gè)節(jié)點(diǎn),一個(gè)非喚醒詞類別(即filler類別)和兩個(gè)喚醒詞類別,本實(shí)施例對基于cnn的語音喚醒模型的輸出中所包含的喚醒詞類別的個(gè)數(shù)不作限定。
喚醒模塊64,用于當(dāng)計(jì)算模塊63獲得的上述語音幀包含的靜態(tài)的語音特征對應(yīng)于喚醒詞類別的后驗(yàn)概率大于或等于預(yù)定閾值時(shí),確定上述在線錄制的語音中包括喚醒詞。
其中,上述預(yù)定閾值可以在具體實(shí)現(xiàn)時(shí),根據(jù)系統(tǒng)性能和/或?qū)崿F(xiàn)需求等自行設(shè)定,本實(shí)施例對上述預(yù)定閾值的大小不作限定,舉例來說,上述預(yù)定閾值可以為75%。
上述基于人工智能的語音喚醒裝置中,分幀模塊61對在線錄制的語音進(jìn)行加窗分幀操作,獲得至少一個(gè)語音幀之后,提取模塊62對上述語音幀進(jìn)行特征提取,獲得語音特征,然后計(jì)算模塊63通過基于卷積神經(jīng)網(wǎng)絡(luò)的語音喚醒模型對上述語音幀包含的靜態(tài)的語音特征進(jìn)行計(jì)算,獲得上述語音幀包含的靜態(tài)的語音特征對應(yīng)于非喚醒詞類別和喚醒詞類別的后驗(yàn)概率,當(dāng)上述語音幀包含的靜態(tài)的語音特征對應(yīng)于喚醒詞類別的后驗(yàn)概率大于或等于預(yù)定閾值時(shí),確定模塊64確定在線錄制的語音中包括喚醒詞,上述基于卷積神經(jīng)網(wǎng)絡(luò)的語音喚醒模型的輸入特征較少,從而可以達(dá)到降低運(yùn)算量的目的,另外該裝置通過使用后驗(yàn)概率的策略,使得運(yùn)算量進(jìn)一步減??;并且該裝置針對喚醒詞和非喚醒詞有更好的區(qū)分度,可以提升語音喚醒的效果;另外,該裝置不需要針對每一個(gè)喚醒詞挑選不同的非喚醒詞,提高了該裝置的通用性。
圖7為本申請基于人工智能的語音喚醒裝置另一個(gè)實(shí)施例的結(jié)構(gòu)示意圖,與圖6所示的基于人工智能的語音喚醒裝置相比,不同之處在于,圖7所示的基于人工智能的語音喚醒裝置還可以包括:
錄制模塊65,用于在分幀模塊61對在線錄制的語音進(jìn)行加窗分幀操作,獲得至少一個(gè)語音幀之前,對用戶輸入的語音進(jìn)行在線錄制。
本實(shí)施例中,對于具有語音喚醒功能的設(shè)備來說,錄制模塊65一直對外部的聲音進(jìn)行在線錄制,以便在用戶輸入語音時(shí),對用戶輸入的語音進(jìn)行在線錄制,以觸發(fā)后續(xù)流程的執(zhí)行。
進(jìn)一步地,本實(shí)施例中,計(jì)算模塊63,還用于在獲得上述語音幀包含的靜態(tài)的語音特征對應(yīng)于非喚醒詞類別和喚醒詞類別的后驗(yàn)概率之后,對預(yù)定數(shù)量的語音幀包含的靜態(tài)的語音特征對應(yīng)于非喚醒詞類別和喚醒詞類別的后驗(yàn)概率分別進(jìn)行累加,獲得預(yù)定數(shù)量的語音幀包含的靜態(tài)的語音特征對應(yīng)于非喚醒詞類別的后驗(yàn)概率,以及預(yù)定數(shù)量的語音幀包含的靜態(tài)的語音特征對應(yīng)于喚醒詞類別的后驗(yàn)概率;
這時(shí),上述語音幀包含的靜態(tài)的語音特征對應(yīng)于喚醒詞類別的后驗(yàn)概率大于或等于預(yù)定閾值包括:預(yù)定數(shù)量的語音幀包含的靜態(tài)的語音特征對應(yīng)于喚醒詞類別的后驗(yàn)概率大于或等于預(yù)定閾值。
也就是說,本實(shí)施例在喚醒詞檢出上,采用固定窗長的平滑策略,計(jì)算模塊63對預(yù)定數(shù)量的語音幀包含的靜態(tài)的語音特征對應(yīng)于非喚醒詞類別和喚醒詞類別的后驗(yàn)概率分別進(jìn)行累加,當(dāng)預(yù)定數(shù)量的語音幀包含的靜態(tài)的語音特征對應(yīng)于喚醒詞類別的后驗(yàn)概率大于或等于預(yù)定閾值時(shí),確定模塊64即確定檢出喚醒詞,也就是確定上述在線錄制的語音中包括喚醒詞。
其中,上述預(yù)定數(shù)量可以在具體實(shí)現(xiàn)時(shí)根據(jù)系統(tǒng)性能和/或?qū)崿F(xiàn)需求自行設(shè)定,本實(shí)施例對上述預(yù)定數(shù)量的大小不作限定。
進(jìn)一步地,上述基于人工智能的語音喚醒裝置還可以包括:
訓(xùn)練模塊66,用于在計(jì)算模塊63通過基于cnn的語音喚醒模型對上述語音幀包含的靜態(tài)的語音特征進(jìn)行計(jì)算之前,基于ctc的訓(xùn)練準(zhǔn)則對基于cnn的初始模型進(jìn)行訓(xùn)練,獲得基于cnn的語音喚醒模型。
本實(shí)施例中,對6層的cnn模型的訓(xùn)練準(zhǔn)則由交叉熵(crossentropy)變?yōu)閏tc,基于ctc的訓(xùn)練準(zhǔn)則對6層的基于cnn的初始模型進(jìn)行訓(xùn)練,可以獲得上述基于cnn的語音喚醒模型。
本實(shí)施例中,訓(xùn)練模塊66可以包括:模型訓(xùn)練子模塊661和數(shù)據(jù)挑選子模塊662;
其中,模型訓(xùn)練子模塊661,用于利用訓(xùn)練數(shù)據(jù),基于ctc的訓(xùn)練準(zhǔn)則對基于cnn的初始模型進(jìn)行訓(xùn)練,獲得基于cnn的種子模型;
數(shù)據(jù)挑選子模塊662,用于通過測試數(shù)據(jù)對上述基于cnn的種子模型進(jìn)行測試,獲得上述基于cnn的種子模型誤識別的測試數(shù)據(jù)。
模型訓(xùn)練子模塊661,還用于通過上述誤識別的測試數(shù)據(jù)對上述基于cnn的種子模型進(jìn)行再次訓(xùn)練,直至上述基于cnn的種子模型在開發(fā)集上收斂,獲得上述基于cnn的語音喚醒模型。
具體地,模型訓(xùn)練子模塊661通過上述誤識別的測試數(shù)據(jù)對上述基于cnn的種子模型進(jìn)行再次訓(xùn)練可以為:將上述基于cnn的種子模型誤識別的測試數(shù)據(jù)添加到訓(xùn)練數(shù)據(jù)中,然后模型訓(xùn)練子模塊661再利用添加了這些測試數(shù)據(jù)的訓(xùn)練數(shù)據(jù),對上述基于cnn的種子模型進(jìn)行再次訓(xùn)練,重復(fù)上述過程,直至上述基于cnn的種子模型在開發(fā)集上收斂,獲得上述基于cnn的語音喚醒模型。
其中,上述開發(fā)集是不同于訓(xùn)練數(shù)據(jù),也不同于測試數(shù)據(jù)的一個(gè)數(shù)據(jù)集,上述開發(fā)集用于對訓(xùn)練獲得的基于cnn的種子模型的喚醒性能進(jìn)行監(jiān)控,以獲得最終的基于cnn的語音喚醒模型;其中,上述基于cnn的種子模型在開發(fā)集上收斂,是指基于cnn的種子模型在開發(fā)集上的喚醒性能不再提高。
也就是說,利用添加了上述基于cnn的種子模型誤識別的測試數(shù)據(jù)的訓(xùn)練數(shù)據(jù),對上述基于cnn的種子模型進(jìn)行再次訓(xùn)練之后,在每一輪訓(xùn)練完成之后,在開發(fā)集上對本輪訓(xùn)練獲得的基于cnn的種子模型的喚醒性能進(jìn)行監(jiān)測,一般來說,基于cnn的種子模型在開發(fā)集上的喚醒性能是先下降,然后經(jīng)過多輪訓(xùn)練之后,基于cnn的種子模型在開發(fā)集上的喚醒性能會慢慢提高,直至基于cnn的種子模型在開發(fā)集上的喚醒性能不再提高,就可以確定上述基于cnn的種子模型在開發(fā)集上收斂,這時(shí)模型訓(xùn)練子模塊661獲得的基于cnn的種子模型即為最終獲得的基于cnn的語音喚醒模型。
本申請實(shí)施例提供的基于人工智能的語音喚醒裝置,通過使用cnn-ctc的方案,大大地縮小了基于cnn的語音喚醒模型的輸出層的節(jié)點(diǎn)數(shù),從而有效地降低了基于cnn的語音喚醒模型的參數(shù)量,達(dá)到降低運(yùn)算量的目的;通過使用后驗(yàn)概率平滑的策略,使得運(yùn)算量進(jìn)一步減??;另外,本申請實(shí)施例提供的基于人工智能的語音喚醒裝置中使用一個(gè)非喚醒詞(filler)類別,增加了訓(xùn)練的靈活性,使得上述基于人工智能的語音喚醒裝置非常的通用,不需要再針對每一個(gè)喚醒詞挑選不同的filler;本申請實(shí)施例提供的基于人工智能的語音喚醒裝置中的基于cnn的語音喚醒模型通過自我學(xué)習(xí)調(diào)優(yōu)的方法,可以更好地提升語音喚醒的效果,另外,上述基于cnn的語音喚醒模型的輸出層簡單,目標(biāo)鮮明,針對喚醒詞和非喚醒詞有更好的區(qū)分度,可以進(jìn)一步提升語音喚醒的效果。
圖8為本申請計(jì)算機(jī)設(shè)備一個(gè)實(shí)施例的結(jié)構(gòu)示意圖,本申請實(shí)施例中的計(jì)算機(jī)設(shè)備可以作為具有語音喚醒功能的設(shè)備實(shí)現(xiàn)本申請實(shí)施例提供的基于人工智能的語音喚醒方法。
其中,上述具有語音喚醒功能的設(shè)備可以為智能手機(jī)、平板電腦或智能家居設(shè)備等,本實(shí)施例對上述具有語音喚醒功能的設(shè)備的形態(tài)不作限定。
如圖8所示,上述計(jì)算機(jī)設(shè)備可以包括:一個(gè)或多個(gè)處理器;存儲裝置,用于存儲一個(gè)或多個(gè)程序,當(dāng)上述一個(gè)或多個(gè)程序被上述一個(gè)或多個(gè)處理器執(zhí)行,使得一個(gè)或多個(gè)處理器實(shí)現(xiàn)本申請實(shí)施例提供的基于人工智能的語音喚醒方法。
圖8示出了適于用來實(shí)現(xiàn)本申請實(shí)施方式的示例性計(jì)算機(jī)設(shè)備12的框圖。圖8顯示的計(jì)算機(jī)設(shè)備12僅僅是一個(gè)示例,不應(yīng)對本申請實(shí)施例的功能和使用范圍帶來任何限制。
如圖8所示,計(jì)算機(jī)設(shè)備12以通用計(jì)算設(shè)備的形式表現(xiàn)。計(jì)算機(jī)設(shè)備12的組件可以包括但不限于:一個(gè)或者多個(gè)處理器或者處理單元16,系統(tǒng)存儲器28,連接不同系統(tǒng)組件(包括系統(tǒng)存儲器28和處理單元16)的總線18。
總線18表示幾類總線結(jié)構(gòu)中的一種或多種,包括存儲器總線或者存儲器控制器,外圍總線,圖形加速端口,處理器或者使用多種總線結(jié)構(gòu)中的任意總線結(jié)構(gòu)的局域總線。舉例來說,這些體系結(jié)構(gòu)包括但不限于工業(yè)標(biāo)準(zhǔn)體系結(jié)構(gòu)(industrystandardarchitecture;以下簡稱:isa)總線,微通道體系結(jié)構(gòu)(microchannelarchitecture;以下簡稱:mac)總線,增強(qiáng)型isa總線、視頻電子標(biāo)準(zhǔn)協(xié)會(videoelectronicsstandardsassociation;以下簡稱:vesa)局域總線以及外圍組件互連(peripheralcomponentinterconnection;以下簡稱:pci)總線。
計(jì)算機(jī)設(shè)備12典型地包括多種計(jì)算機(jī)系統(tǒng)可讀介質(zhì)。這些介質(zhì)可以是任何能夠被計(jì)算機(jī)設(shè)備12訪問的可用介質(zhì),包括易失性和非易失性介質(zhì),可移動的和不可移動的介質(zhì)。
系統(tǒng)存儲器28可以包括易失性存儲器形式的計(jì)算機(jī)系統(tǒng)可讀介質(zhì),例如隨機(jī)存取存儲器(randomaccessmemory;以下簡稱:ram)30和/或高速緩存存儲器32。計(jì)算機(jī)設(shè)備12可以進(jìn)一步包括其它可移動/不可移動的、易失性/非易失性計(jì)算機(jī)系統(tǒng)存儲介質(zhì)。僅作為舉例,存儲系統(tǒng)34可以用于讀寫不可移動的、非易失性磁介質(zhì)(圖8未顯示,通常稱為“硬盤驅(qū)動器”)。盡管圖8中未示出,可以提供用于對可移動非易失性磁盤(例如“軟盤”)讀寫的磁盤驅(qū)動器,以及對可移動非易失性光盤(例如:光盤只讀存儲器(compactdiscreadonlymemory;以下簡稱:cd-rom)、數(shù)字多功能只讀光盤(digitalvideodiscreadonlymemory;以下簡稱:dvd-rom)或者其它光介質(zhì))讀寫的光盤驅(qū)動器。在這些情況下,每個(gè)驅(qū)動器可以通過一個(gè)或者多個(gè)數(shù)據(jù)介質(zhì)接口與總線18相連。存儲器28可以包括至少一個(gè)程序產(chǎn)品,該程序產(chǎn)品具有一組(例如至少一個(gè))程序模塊,這些程序模塊被配置以執(zhí)行本申請各實(shí)施例的功能。
具有一組(至少一個(gè))程序模塊42的程序/實(shí)用工具40,可以存儲在例如存儲器28中,這樣的程序模塊42包括——但不限于——操作系統(tǒng)、一個(gè)或者多個(gè)應(yīng)用程序、其它程序模塊以及程序數(shù)據(jù),這些示例中的每一個(gè)或某種組合中可能包括網(wǎng)絡(luò)環(huán)境的實(shí)現(xiàn)。程序模塊42通常執(zhí)行本申請所描述的實(shí)施例中的功能和/或方法。
計(jì)算機(jī)設(shè)備12也可以與一個(gè)或多個(gè)外部設(shè)備14(例如鍵盤、指向設(shè)備、顯示器24等)通信,還可與一個(gè)或者多個(gè)使得用戶能與該計(jì)算機(jī)設(shè)備12交互的設(shè)備通信,和/或與使得該計(jì)算機(jī)設(shè)備12能與一個(gè)或多個(gè)其它計(jì)算設(shè)備進(jìn)行通信的任何設(shè)備(例如網(wǎng)卡,調(diào)制解調(diào)器等等)通信。這種通信可以通過輸入/輸出(i/o)接口22進(jìn)行。并且,計(jì)算機(jī)設(shè)備12還可以通過網(wǎng)絡(luò)適配器20與一個(gè)或者多個(gè)網(wǎng)絡(luò)(例如局域網(wǎng)(localareanetwork;以下簡稱:lan),廣域網(wǎng)(wideareanetwork;以下簡稱:wan)和/或公共網(wǎng)絡(luò),例如因特網(wǎng))通信。如圖所示,網(wǎng)絡(luò)適配器20通過總線18與計(jì)算機(jī)設(shè)備12的其它模塊通信。應(yīng)當(dāng)明白,盡管圖8中未示出,可以結(jié)合計(jì)算機(jī)設(shè)備12使用其它硬件和/或軟件模塊,包括但不限于:微代碼、設(shè)備驅(qū)動器、冗余處理單元、外部磁盤驅(qū)動陣列、raid系統(tǒng)、磁帶驅(qū)動器以及數(shù)據(jù)備份存儲系統(tǒng)等。
處理單元16通過運(yùn)行存儲在系統(tǒng)存儲器28中的程序,從而執(zhí)行各種功能應(yīng)用以及數(shù)據(jù)處理,例如實(shí)現(xiàn)本申請實(shí)施例提供的基于人工智能的語音喚醒方法。
本申請實(shí)施例還提供一種計(jì)算機(jī)可讀介質(zhì),其上存儲有計(jì)算機(jī)程序,上述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)本申請實(shí)施例提供的基于人工智能的語音喚醒方法。
上述計(jì)算機(jī)可讀介質(zhì)可以采用一個(gè)或多個(gè)計(jì)算機(jī)可讀的介質(zhì)的任意組合。計(jì)算機(jī)可讀介質(zhì)可以是計(jì)算機(jī)可讀信號介質(zhì)或者計(jì)算機(jī)可讀存儲介質(zhì)。計(jì)算機(jī)可讀存儲介質(zhì)例如可以是——但不限于——電、磁、光、電磁、紅外線、或半導(dǎo)體的系統(tǒng)、裝置或器件,或者任意以上的組合。計(jì)算機(jī)可讀存儲介質(zhì)的更具體的例子(非窮舉的列表)包括:具有一個(gè)或多個(gè)導(dǎo)線的電連接、便攜式計(jì)算機(jī)磁盤、硬盤、隨機(jī)存取存儲器(ram)、只讀存儲器(readonlymemory;以下簡稱:rom)、可擦式可編程只讀存儲器(erasableprogrammablereadonlymemory;以下簡稱:eprom)或閃存、光纖、便攜式緊湊磁盤只讀存儲器(cd-rom)、光存儲器件、磁存儲器件、或者上述的任意合適的組合。在本文件中,計(jì)算機(jī)可讀存儲介質(zhì)可以是任何包含或存儲程序的有形介質(zhì),該程序可以被指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用。
計(jì)算機(jī)可讀的信號介質(zhì)可以包括在基帶中或者作為載波一部分傳播的數(shù)據(jù)信號,其中承載了計(jì)算機(jī)可讀的程序代碼。這種傳播的數(shù)據(jù)信號可以采用多種形式,包括——但不限于——電磁信號、光信號或上述的任意合適的組合。計(jì)算機(jī)可讀的信號介質(zhì)還可以是計(jì)算機(jī)可讀存儲介質(zhì)以外的任何計(jì)算機(jī)可讀介質(zhì),該計(jì)算機(jī)可讀介質(zhì)可以發(fā)送、傳播或者傳輸用于由指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用的程序。
計(jì)算機(jī)可讀介質(zhì)上包含的程序代碼可以用任何適當(dāng)?shù)慕橘|(zhì)傳輸,包括——但不限于——無線、電線、光纜、rf等等,或者上述的任意合適的組合。
可以以一種或多種程序設(shè)計(jì)語言或其組合來編寫用于執(zhí)行本申請操作的計(jì)算機(jī)程序代碼,所述程序設(shè)計(jì)語言包括面向?qū)ο蟮某绦蛟O(shè)計(jì)語言—諸如java、smalltalk、c++,還包括常規(guī)的過程式程序設(shè)計(jì)語言—諸如“c”語言或類似的程序設(shè)計(jì)語言。程序代碼可以完全地在用戶計(jì)算機(jī)上執(zhí)行、部分地在用戶計(jì)算機(jī)上執(zhí)行、作為一個(gè)獨(dú)立的軟件包執(zhí)行、部分在用戶計(jì)算機(jī)上部分在遠(yuǎn)程計(jì)算機(jī)上執(zhí)行、或者完全在遠(yuǎn)程計(jì)算機(jī)或服務(wù)器上執(zhí)行。在涉及遠(yuǎn)程計(jì)算機(jī)的情形中,遠(yuǎn)程計(jì)算機(jī)可以通過任意種類的網(wǎng)絡(luò)——包括局域網(wǎng)(localareanetwork;以下簡稱:lan)或廣域網(wǎng)(wideareanetwork;以下簡稱:wan)連接到用戶計(jì)算機(jī),或者,可以連接到外部計(jì)算機(jī)(例如利用因特網(wǎng)服務(wù)提供商來通過因特網(wǎng)連接)。
需要說明的是,在本申請的描述中,術(shù)語“第一”、“第二”等僅用于描述目的,而不能理解為指示或暗示相對重要性。此外,在本申請的描述中,除非另有說明,“多個(gè)”的含義是兩個(gè)或兩個(gè)以上。
流程圖中或在此以其他方式描述的任何過程或方法描述可以被理解為,表示包括一個(gè)或更多個(gè)用于實(shí)現(xiàn)特定邏輯功能或過程的步驟的可執(zhí)行指令的代碼的模塊、片段或部分,并且本申請的優(yōu)選實(shí)施方式的范圍包括另外的實(shí)現(xiàn),其中可以不按所示出或討論的順序,包括根據(jù)所涉及的功能按基本同時(shí)的方式或按相反的順序,來執(zhí)行功能,這應(yīng)被本申請的實(shí)施例所屬技術(shù)領(lǐng)域的技術(shù)人員所理解。
應(yīng)當(dāng)理解,本申請的各部分可以用硬件、軟件、固件或它們的組合來實(shí)現(xiàn)。在上述實(shí)施方式中,多個(gè)步驟或方法可以用存儲在存儲器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件或固件來實(shí)現(xiàn)。例如,如果用硬件來實(shí)現(xiàn),和在另一實(shí)施方式中一樣,可用本領(lǐng)域公知的下列技術(shù)中的任一項(xiàng)或他們的組合來實(shí)現(xiàn):具有用于對數(shù)據(jù)信號實(shí)現(xiàn)邏輯功能的邏輯門電路的離散邏輯電路,具有合適的組合邏輯門電路的專用集成電路,可編程門陣列(programmablegatearray;以下簡稱:pga),現(xiàn)場可編程門陣列(fieldprogrammablegatearray;以下簡稱:fpga)等。
本技術(shù)領(lǐng)域的普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法攜帶的全部或部分步驟是可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲于一種計(jì)算機(jī)可讀存儲介質(zhì)中,該程序在執(zhí)行時(shí),包括方法實(shí)施例的步驟之一或其組合。
此外,本申請各個(gè)實(shí)施例中的各功能模塊可以集成在一個(gè)處理模塊中,也可以是各個(gè)模塊單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上模塊集成在一個(gè)模塊中。上述集成的模塊既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能模塊的形式實(shí)現(xiàn)。所述集成的模塊如果以軟件功能模塊的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),也可以存儲在一個(gè)計(jì)算機(jī)可讀取存儲介質(zhì)中。
上述提到的存儲介質(zhì)可以是只讀存儲器,磁盤或光盤等。
在本說明書的描述中,參考術(shù)語“一個(gè)實(shí)施例”、“一些實(shí)施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本申請的至少一個(gè)實(shí)施例或示例中。在本說明書中,對上述術(shù)語的示意性表述不一定指的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任何的一個(gè)或多個(gè)實(shí)施例或示例中以合適的方式結(jié)合。
盡管上面已經(jīng)示出和描述了本申請的實(shí)施例,可以理解的是,上述實(shí)施例是示例性的,不能理解為對本申請的限制,本領(lǐng)域的普通技術(shù)人員在本申請的范圍內(nèi)可以對上述實(shí)施例進(jìn)行變化、修改、替換和變型。