本發(fā)明屬于語(yǔ)音識(shí)別技術(shù)領(lǐng)域,涉及一種語(yǔ)音轉(zhuǎn)寫校正系統(tǒng),具體是一種基于分核處理技術(shù)的語(yǔ)音快速轉(zhuǎn)寫校正系統(tǒng)。
背景技術(shù):
目前,電視臺(tái)字幕都是預(yù)先準(zhǔn)備好的,然后播音員讀出來(lái),觀眾也是看著文字聽(tīng)聲音,印象深刻,但是,預(yù)先需要準(zhǔn)備文字,耗費(fèi)時(shí)間,采編也比較麻煩,并且在直播采訪時(shí)無(wú)法同步字幕;還有很多會(huì)議,都是速錄師打字,觀眾根據(jù)文字聽(tīng)聲音,但是,都是聲音讀完了,文字才出來(lái),不能同步,文字也只是一些要點(diǎn)記錄,使用語(yǔ)音速記本,也是先有聲音,文字才能顯示,但是,修改的時(shí)候,修改的速度跟不上說(shuō)話的速度,從而,修改難以持續(xù)下去,因而,需要提供一種聲音和文字能夠同步輸出的系統(tǒng),本案由此產(chǎn)生。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于提供一種使用方便、準(zhǔn)確率高的基于分核處理技術(shù)的語(yǔ)音快速轉(zhuǎn)寫校正系統(tǒng)。
本發(fā)明的目的可以通過(guò)以下技術(shù)方案實(shí)現(xiàn):
基于分核處理技術(shù)的語(yǔ)音快速轉(zhuǎn)寫校正系統(tǒng),包括語(yǔ)音采集單元、錄音單元、數(shù)據(jù)存儲(chǔ)單元、語(yǔ)音識(shí)別處理器、錄音播放處理器、文檔編輯器、微控制器、輸入單元、顯示器以及音頻播放器;
所述的語(yǔ)音采集單元連接錄音單元和語(yǔ)音識(shí)別處理器,用于采集用戶的語(yǔ)音信息,并輸出到錄音單元和語(yǔ)音識(shí)別處理器;
所述的錄音單元連接數(shù)據(jù)存儲(chǔ)單元和錄音播放處理器,用于錄制用戶的語(yǔ)音信息,并進(jìn)行編碼,生成音頻文件,將錄制的語(yǔ)音信息實(shí)時(shí)發(fā)送到錄音播放處理器,將最終生成的音頻文件發(fā)送到數(shù)據(jù)存儲(chǔ)單元;
所述的輸入單元連接微控制器和文檔編輯器,用于向微控制器輸入控制指令以及向文檔編輯器輸入文字信息;
所述的微控制器連接語(yǔ)音識(shí)別處理器和錄音播放處理器,用于根據(jù)接收到的控制指令,輸出控制信號(hào)分別控制語(yǔ)音識(shí)別處理器和錄音播放處理器;
所述的語(yǔ)音識(shí)別處理器連接文檔編輯器,用于對(duì)接收到的語(yǔ)音信息進(jìn)行識(shí)別,轉(zhuǎn)寫為文字信息,發(fā)送到文檔編輯器;
所述的文檔編輯器連接顯示器和數(shù)據(jù)存儲(chǔ)單元,用于將接收到的文字信息發(fā)送到顯示器進(jìn)行實(shí)時(shí)顯示,同時(shí)用戶可通過(guò)輸入單元對(duì)文檔編輯器內(nèi)文字信息進(jìn)行修改,最終生成文檔文件輸出到數(shù)據(jù)存儲(chǔ)單元;
所述的數(shù)據(jù)存儲(chǔ)單元,用于保存接收到的音頻文件和文檔文件;
所述的錄音播放處理器連接音頻播放器,用于對(duì)錄音單元錄制的語(yǔ)音信息進(jìn)行處理,生成音頻流輸出到音頻播放器進(jìn)行在線播放,并根據(jù)微控制器的控制信號(hào)控制錄音的播放/暫停。
進(jìn)一步地,所述的錄音播放處理器包括
時(shí)鐘模塊,用于記錄錄音播放的起始時(shí)間以及停止時(shí)間;
播放模塊,用于對(duì)錄音單元錄制的語(yǔ)音信息進(jìn)行處理,生成音頻流輸出;
延時(shí)模塊,用于將播放模塊生成的音頻流延遲預(yù)設(shè)時(shí)間后輸出;其中,預(yù)設(shè)時(shí)間為500ms。
本發(fā)明的有益效果:本發(fā)明通過(guò)語(yǔ)音采集單元獲取語(yǔ)音信息,通過(guò)錄音單元錄制語(yǔ)音信息,通過(guò)語(yǔ)音識(shí)別處理器將語(yǔ)音轉(zhuǎn)寫為文字,通過(guò)錄音播放處理器播放錄音,基于分核處理技術(shù),雙核雙線程同時(shí)工作,實(shí)現(xiàn)錄音和文字同步處理,并且通過(guò)延時(shí)模塊將錄音延時(shí)輸出,用戶先瀏覽文字,再收聽(tīng)到錄音,方便用戶理解錄音內(nèi)容,更好的對(duì)文字進(jìn)行修正;使用微控制器對(duì)兩個(gè)處理器單獨(dú)控制,在不影響將語(yǔ)音轉(zhuǎn)寫為文字的情況下,單獨(dú)控制錄音在線播放或暫停,方便用戶校正文字,提高語(yǔ)音識(shí)別和文字校正的準(zhǔn)確性。
附圖說(shuō)明
下面結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步詳細(xì)描述。
圖1是本發(fā)明的系統(tǒng)示意圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其它實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
如圖1所示,本發(fā)明提供了一種基于分核處理技術(shù)的語(yǔ)音快速轉(zhuǎn)寫校正系統(tǒng),包括語(yǔ)音采集單元、錄音單元、數(shù)據(jù)存儲(chǔ)單元、語(yǔ)音識(shí)別處理器、錄音播放處理器、文檔編輯器、微控制器(MCU)、輸入單元、顯示器以及音頻播放器。
語(yǔ)音采集單元連接錄音單元和語(yǔ)音識(shí)別處理器,用于采集用戶的語(yǔ)音信息,并輸出到錄音單元和語(yǔ)音識(shí)別處理器;其中,語(yǔ)音采集單元使用高清麥克風(fēng)采集語(yǔ)音信息。
錄音單元連接數(shù)據(jù)存儲(chǔ)單元和錄音播放處理器,用于錄制用戶的語(yǔ)音信息,并進(jìn)行編碼,生成音頻文件,將錄制的語(yǔ)音信息實(shí)時(shí)發(fā)送到錄音播放處理器,將最終生成的音頻文件發(fā)送到數(shù)據(jù)存儲(chǔ)單元。
輸入單元連接微控制器和文檔編輯器,用于向微控制器輸入控制指令以及向文檔編輯器輸入文字信息;其中,輸入單元可采用鼠標(biāo)、鍵盤或觸摸屏等。
微控制器連接語(yǔ)音識(shí)別處理器和錄音播放處理器,用于根據(jù)接收到的控制指令,采用分核處理技術(shù),輸出控制信號(hào)分別控制語(yǔ)音識(shí)別處理器和錄音播放處理器。
語(yǔ)音識(shí)別處理器連接文檔編輯器,用于對(duì)接收到的語(yǔ)音信息進(jìn)行識(shí)別,轉(zhuǎn)寫為文字信息,發(fā)送到文檔編輯器。
文檔編輯器連接顯示器和數(shù)據(jù)存儲(chǔ)單元,用于將接收到的文字信息發(fā)送到顯示器進(jìn)行實(shí)時(shí)顯示,同時(shí)用戶可通過(guò)輸入單元對(duì)文檔編輯器內(nèi)文字信息進(jìn)行修改,最終生成文檔文件輸出到數(shù)據(jù)存儲(chǔ)單元。
數(shù)據(jù)存儲(chǔ)單元,用于保存接收到的音頻文件和文檔文件;其中,數(shù)據(jù)存儲(chǔ)單元采用本地硬盤。
錄音播放處理器連接音頻播放器,用于對(duì)錄音單元錄制的語(yǔ)音信息進(jìn)行處理,生成音頻流輸出到音頻播放器進(jìn)行在線播放,并根據(jù)微控制器的控制信號(hào)控制錄音的播放/暫停。
錄音播放處理器包括時(shí)鐘模塊、播放模塊和延時(shí)模塊。
時(shí)鐘模塊,用于記錄錄音播放的起始時(shí)間以及停止時(shí)間。
播放模塊,用于對(duì)錄音單元錄制的語(yǔ)音信息進(jìn)行處理,生成音頻流輸出。
延時(shí)模塊,用于將播放模塊生成的音頻流延遲預(yù)設(shè)時(shí)間后輸出;其中,預(yù)設(shè)時(shí)間為500ms。
本發(fā)明工作過(guò)程:首先,語(yǔ)音采集單元采集用戶語(yǔ)音信息,并發(fā)送到錄音單元和語(yǔ)音識(shí)別處理器,錄音單元對(duì)語(yǔ)音信息進(jìn)行錄制,并進(jìn)行編碼,生成音頻文件存儲(chǔ)到數(shù)據(jù)存儲(chǔ)單元,同時(shí)將錄制的語(yǔ)音信息實(shí)時(shí)發(fā)送到錄音播放處理器;
用戶通過(guò)輸入單元輸入控制指令,微控制器根據(jù)接收到的控制指令分別控制語(yǔ)音識(shí)別處理器和錄音播放處理器工作,語(yǔ)音識(shí)別處理器對(duì)接收到的語(yǔ)音信息進(jìn)行識(shí)別,轉(zhuǎn)寫為文字信息,發(fā)送到文檔編輯器,并通過(guò)顯示器實(shí)時(shí)顯示;錄音播放處理器的播放模塊對(duì)錄音單元錄制的語(yǔ)音信息進(jìn)行處理,生成音頻流,經(jīng)延時(shí)模塊延時(shí)500ms后,輸出到音頻播放器進(jìn)行在線播放,同時(shí),通過(guò)時(shí)鐘模塊記錄播放的起始時(shí)間。
用戶通過(guò)顯示器查看文字信息,通過(guò)音頻播放器收聽(tīng)錄音,通過(guò)輸入單元對(duì)文檔編輯器內(nèi)的文字進(jìn)行修正,并生成文本文檔保存到數(shù)據(jù)存儲(chǔ)單元。由于錄音延遲播放,用戶先瀏覽文字,再收聽(tīng)到錄音,方便用戶理解錄音內(nèi)容,更好的對(duì)文字進(jìn)行修正。
當(dāng)用戶修正文字編輯器內(nèi)的文字時(shí),可通過(guò)輸入單元輸入控制指令,微處理器控制錄音播放處理器暫停工作,暫停錄音的播放,此時(shí)時(shí)鐘模塊記錄播放的停止時(shí)間;當(dāng)用戶需要繼續(xù)播放錄音時(shí),通過(guò)輸入單元輸入控制指令,微處理器控制錄音播放處理器工作,播放模塊根據(jù)時(shí)鐘模塊記錄的起始時(shí)間和停止時(shí)間獲取錄音的播放時(shí)間,從暫停節(jié)點(diǎn)開(kāi)始繼續(xù)播放,時(shí)鐘模塊再次記錄播放的起始時(shí)間,實(shí)現(xiàn)錄音在線播放的播放/暫停,方便用戶校正文字。
本發(fā)明通過(guò)語(yǔ)音采集單元獲取語(yǔ)音信息,通過(guò)錄音單元錄制語(yǔ)音信息,通過(guò)語(yǔ)音識(shí)別處理器將語(yǔ)音轉(zhuǎn)寫為文字,通過(guò)錄音播放處理器播放錄音,基于分核處理技術(shù),雙核雙線程同時(shí)工作,實(shí)現(xiàn)錄音和文字同步處理,并且通過(guò)延時(shí)模塊將錄音延時(shí)輸出,用戶先瀏覽文字,再收聽(tīng)到錄音,方便用戶理解錄音內(nèi)容,更好的對(duì)文字進(jìn)行修正;使用微控制器對(duì)兩個(gè)處理器單獨(dú)控制,在不影響將語(yǔ)音轉(zhuǎn)寫為文字的情況下,單獨(dú)控制錄音在線播放或暫停,方便用戶校正文字,提高語(yǔ)音識(shí)別和文字校正的準(zhǔn)確性,可廣泛用于會(huì)議記錄、直播字幕制作等方面。
在本說(shuō)明書的描述中,參考術(shù)語(yǔ)“一個(gè)實(shí)施例”、“示例”、“具體示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本發(fā)明的至少一個(gè)實(shí)施例或示例中。在本說(shuō)明書中,對(duì)上述術(shù)語(yǔ)的示意性表述不一定指的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任何的一個(gè)或多個(gè)實(shí)施例或示例中以合適的方式結(jié)合。
以上內(nèi)容僅僅是對(duì)本發(fā)明結(jié)構(gòu)所作的舉例和說(shuō)明,所屬本技術(shù)領(lǐng)域的技術(shù)人員對(duì)所描述的具體實(shí)施例做各種各樣的修改或補(bǔ)充或采用類似的方式替代,只要不偏離發(fā)明的結(jié)構(gòu)或者超越本權(quán)利要求書所定義的范圍,均應(yīng)屬于本發(fā)明的保護(hù)范圍。