語音識別裝置、具有語音識別裝置的車輛及其控制方法_4

文檔序號：9598804閱讀：來源：國知局

D裝置250可認證用戶終端UT。認證用戶終端UT的方法不受限制。例如，VAD裝置250可通過顯示單元220顯示預定的認證碼，并且如果顯示的認證碼在被傳輸至用戶終端UT之后被VAD裝置250接收，則確定用戶終端UT是經(jīng)過認證的用戶終端。
[0138]更具體地，如圖8所示，控制器260可控制顯示單元220，以根據(jù)來自VAD裝置250的請求顯示包括認證碼的認證畫面。同時，如果請求訪問VAD裝置250的用戶終端UT是已經(jīng)經(jīng)過認證的用戶終端，則可以省去認證用戶終端UT的操作S503。
[0139]然后，在操作S505中，VAD裝置250可確定是否存在存儲在其中的電話簿。更具體地，VAD裝置250可確定VAD裝置250是否存儲用戶終端UT中所存儲的電話簿。
[0140]如果VAD裝置250確定不存在電話簿(在操作S505中，“否”)，則在操作S507中，VAD裝置250可從用戶終端UT接收電話簿，并且在操作S509中，存儲所接收的電話簿。接收的電話簿可被存儲在VAD裝置250中或者存儲單元240中(見圖6)。
[0141]另一方面，如果VAD裝置250確定存在電話簿(在操作S505中，“是”)，則在操作(S511)中，VAD裝置250可等待呼叫連接。
[0142]如果VAD裝置250連接至用戶終端UT，則駕駛員可通過聲音單元230 (見圖6)或者安裝在車輛1內部的語音接收器110 (見圖3)撥打電話。
[0143]控制器260可控制車輛1的整體操作。更具體地，控制器160可控制語音識別裝置100和VAD裝置250。
[0144]例如，如果控制器260通過VAD裝置250從用戶終端UT接收電話，則控制器260可通過聲音單元230通知接收該電話，或者可通過語音識別裝置100根據(jù)語音識別的結果搜索電話簿并且將搜索結果提供給顯示單元220，因此，駕駛員可向希望的電話號碼撥打電話。
[0145]控制器260可對應于一個或者多個處理器。處理器可被實施為多個邏輯門的陣列或者通用微處理器和存儲可在微處理器上執(zhí)行的程序的存儲器的組合。然而，對本領域普通技術人員顯而易見的是，控制器260可被實施為不同種類的硬件。
[0146]在下文中，將參考圖9詳細描述使用語音識別連接電話的方法。
[0147]圖9是根據(jù)本公開的實施方式的用于描述通過語音識別裝置100進行呼叫連接的流程圖。
[0148]如圖9所示，在操作S610中，語音識別裝置100可創(chuàng)建電話簿上下文模型150(見圖3)。如上所述，語音識別裝置100可基于通過為語音識別目標建模而創(chuàng)建的上下文模型150執(zhí)行語音識別。
[0149]因此，語音識別裝置100可基于電話簿創(chuàng)建電話簿上下文模型150。在下文中，將詳細描述創(chuàng)建電話簿上下文模型150的方法。
[0150]圖10是用于描述創(chuàng)建電話簿上下文模型150的方法的實例的流程圖，并且圖11是用于描述對電話簿中包括的電話號碼進行分類的方法的實例的示圖。
[0151]參考圖10和圖11，在操作S611中，語音識別裝置100可根據(jù)名稱長度對電話簿中包括的電話號碼進行分類。每個名稱的長度均可以是組成名稱的字的數(shù)目和組成名稱的音節(jié)的數(shù)目中的至少一個。
[0152]如圖11所示，電話簿可包括多個名稱和被映射至相應名稱的多個電話號碼。電話簿中包括的名稱長度可以是不同的。例如，名稱可由名和姓構成，諸如“David Willson”或者“James Smith”等，可由名和姓中的一個構成，諸如“John”或者“Johnson”等，或者可以是諸如“Mom”或者“Home”等簡稱。
[0153]語音識別裝置100可根據(jù)與講話長度匹配的名稱長度對電話簿進行分類。
[0154]根據(jù)實施方式，語音識別裝置100可根據(jù)名稱中包括的字串的數(shù)目對電話簿進行分類。語音識別裝置100可將由兩個或者多個字串構成的“David Willson”或者“JamesSmith”分類成第一上下文模型151，并且將每個由單個字構成的“John”、“Johnson”、“Mom”、以及“Home”分類成第二上下文模型152。
[0155]此外，語音識別裝置100可提取由兩個或者多個字串構成的名稱的每個字以配置第三上下文模型153。S卩，如果名稱由名和姓構成，則語音識別裝置100可使名與姓分開以創(chuàng)建第三上下文模型153。
[0156]此外，在操作S613中，語音識別裝置100可將每個名稱均轉換成音素串。更具體地，語音識別裝置100可使用T2P轉換或者G2P轉換將每個名稱均轉換成音素串。此處，音素串可以是名稱的音符組。
[0157]然后，在操作S615中，語音識別裝置100可基于音素串創(chuàng)建語音網(wǎng)格。
[0158]根據(jù)另一實施方式，語音識別裝置100可根據(jù)每個名稱的音節(jié)長度配置電話簿。
[0159]更具體地，語音識別裝置100可將電話簿中包括的每個名稱均轉換成音素串，計算音素串的輔音數(shù)目以計算音素串的音節(jié)長度，根據(jù)音節(jié)長度對音素串進行分類，并且然后創(chuàng)建語音網(wǎng)格。
[0160]因此，通過根據(jù)與講話長度具有高度相關性的音節(jié)長度對電話簿進行分類，可以更為有效地施加可靠性權重值。
[0161]另一方面，如果存在已經(jīng)創(chuàng)建的上下文模型150，則可以省去創(chuàng)建上下文模型150的操作610。
[0162]圖12示出了用于語音識別的導向畫面的實例。
[0163]再次參考圖9，在操作S620中，語音識別裝置100可確定是否接收語音。如圖12所示，當確定是否接收語音時，語音識別裝置100可顯示通知語音識別功能處于啟用狀態(tài)的畫面。
[0164]更具體地，顯示單元220(見圖6)可在畫面的上部區(qū)域顯示主頁按鈕221和后退按鈕222，并且在畫面的下部區(qū)域顯示列出用于執(zhí)行車輛的各種功能的圖標的圖標列表224。此外，可以在在位于畫面中心處的信息顯示區(qū)域223中顯示通知用戶語音識別功能處于啟用狀態(tài)的導向信息。
[0165]如果語音識別裝置100確定接收語音(在操作S620中，“是”)，則在操作S630中，語音識別裝置100可對相應的語音信號執(zhí)行預處理。S卩，語音識別裝置100可從用戶的語音中檢測識別目標部分，或者去除識別目標部分的語音信號中的噪音成分。
[0166]然后，在操作S640中，語音識別裝置100可創(chuàng)建電話號碼候選組。在下文中，將參考圖13詳細描述創(chuàng)建電話號碼候選組的方法。
[0167]圖13是用于描述創(chuàng)建電話號碼候選組的方法的實例的流程圖。參考圖13，在操作S641中，語音識別裝置100可從接收的語音信號中提取特征向量。例如，語音識別裝置100可使用線性預測系數(shù)、倒譜、MFCC、濾波器組能等提取特征向量。
[0168]在操作S642中，語音識別裝置100可根據(jù)特征向量從聲學模型140識別音素串。更具體地，語音識別裝置100可比較從接收的語音信號中提取的特征向量與聲學模型140，以識別對應于所接收的語音信號的音素串。
[0169]在操作S643中，語音識別裝置100可從第一上下文模型151創(chuàng)建第一候選組。更具體地，語音識別裝置100可使對應于所接收的語音信號的音素串與第一上下文模型151的語音網(wǎng)格進行模式匹配，以創(chuàng)建對于音素串具有預定可靠性程度的第一候選組。此處，可靠性程度代表語音網(wǎng)格與音素串之間的相似性程度。
[0170]可以提前設置第一候選組中所包括的候選項數(shù)目。例如，語音識別裝置100可搜索具有最高可靠性程度的N個候選項以創(chuàng)建第一候選組。
[0171]此外，語音識別裝置100可創(chuàng)建由具有高于參考可靠性程度的可靠性程度的候選項構成的第一候選組。
[0172]此外，在操作S644中，語音識別裝置100可從第二上下文模型152創(chuàng)建第二候選組，并且在操作S645中，從第三上下文模型153創(chuàng)建第三候選組。
[0173]另一方面，在圖13中，示出了其中語音識別裝置100同時創(chuàng)建第一至第三候選組的實例；然而，語音識別裝置100可順次搜索第一至第三上下文模型150，從而順次創(chuàng)建第一至第三候選組。
[0174]再次參考圖9，在操作S650中，語音識別裝置100可將根據(jù)講話長度確定的可靠性權重值施加至候選組。在下文中，將參考圖14詳細描述施加可靠性權重值的方法。
[0175]圖14是用于描述施加可靠性權重值的方法的實例的流程圖，并且圖15示出了列出可靠性權重值的實例的表格。參考圖14，在操作S651中，語音識別裝置100可測量講話長度。即，語音識別裝置100可檢測BoS和EoS，并且計算BoS與EoS之間的差以測量用戶的講話長度。
[0176]然后，在操作S652中，語音識別裝置100可根據(jù)講話長度確定被施加給候選組的可靠性權重值。如上所述，用戶講話長度通常與音節(jié)長度成比例。因此，語音識別裝置100可測量用戶的講話長度，并且將可靠性權重值確定為使得高可靠性權重值被施加給對應于測量的講話長度的候選項。
[0177]另一方面，已經(jīng)通過根據(jù)名稱長度進行分類創(chuàng)建第一至第三候選組。語音識別裝置100可確定被施加給第一至第三候選組的可靠性權重值。
[0178]例如，如圖14所示，語音識別裝置100可根據(jù)講話長度確定候選組的可靠性權重值。更具體地，如果講話長度短于或者等于500ms，則語音識別裝置100可將對應于相對較長名稱的第一候選組的第一權重值設置成較小的值

完整全部詳細技術資料下載

當前第4頁1 2 3 4 5

相關技術