本發(fā)明涉及人工智能,尤其是涉及一種語音控制設(shè)備的方法、裝置、電子設(shè)備及介質(zhì)。
背景技術(shù):
1、隨著智能穿戴設(shè)備的持續(xù)發(fā)展,越來越多的智能穿戴設(shè)備被應(yīng)用到社會生活中。為了提高智能穿戴設(shè)備的智能性,可以通過語音控制智能穿戴設(shè)備的操作。目前,現(xiàn)有的方法中通常是簡單地語音類喚醒,以及基于內(nèi)置的語音控制算法進行控制,然而內(nèi)置的語音控制算法通過詞條嵌入進行識別,表現(xiàn)呆板,一旦用戶的語音超過詞條范圍內(nèi)的內(nèi)容則無法進行識別,從而無法控制智能穿戴設(shè)備的操作。
技術(shù)實現(xiàn)思路
1、有鑒于此,本發(fā)明的目的在于提供一種語音控制設(shè)備的方法、裝置、電子設(shè)備及介質(zhì),以提升了語音控制的識別準確率,進而提升了設(shè)備的智能性和用戶的體驗感。
2、為了實現(xiàn)上述目的,本發(fā)明實施例采用的技術(shù)方案如下:
3、第一方面,本發(fā)明實施例提供了一種語音控制設(shè)備的方法,包括:獲取用戶通過智能穿戴設(shè)備輸入的音頻數(shù)據(jù),并將音頻數(shù)據(jù)轉(zhuǎn)換成文本信息;其中,音頻數(shù)據(jù)用于描述要控制智能穿戴設(shè)備執(zhí)行的操作內(nèi)容;基于大語言模型對文本信息進行內(nèi)容識別得到控制智能穿戴設(shè)備的文字指令,并將文字指令發(fā)送至預(yù)先訓(xùn)練的設(shè)備垂直領(lǐng)域模型,基于設(shè)備垂直領(lǐng)域模型匹配文字指令對應(yīng)的設(shè)備操作協(xié)議指令;將設(shè)備操作協(xié)議指令返回至智能穿戴設(shè)備,以使智能穿戴設(shè)備執(zhí)行對應(yīng)的設(shè)備操作。
4、在一種實施方式中,將音頻數(shù)據(jù)轉(zhuǎn)換成文本信息之后,還包括:將文本信息與歷史消息管道中緩存的歷史文字指令進行匹配;如果匹配成功,則從歷史消息管道中獲取與文本信息匹配的歷史文字指令,并將歷史文字指令發(fā)送至設(shè)備垂直領(lǐng)域模型中,基于設(shè)備垂直領(lǐng)域模型匹配歷史文字指令對應(yīng)的設(shè)備操作協(xié)議指令;如果匹配失敗,則基于大語言模型對文本信息進行內(nèi)容識別得到控制智能穿戴設(shè)備的文字指令,并將文字指令發(fā)送至設(shè)備垂直領(lǐng)域模型中,基于設(shè)備垂直領(lǐng)域模型匹配文字指令對應(yīng)的設(shè)備操作協(xié)議指令。
5、在一種實施方式中,基于大語言模型對文本信息進行內(nèi)容識別得到控制智能穿戴設(shè)備的文字指令,包括:基于大語言模型對文本信息進行內(nèi)容識別,得到控制智能穿戴設(shè)備的語言描述內(nèi)容;通過檢索增強生成模型調(diào)用指令命令多語言描述庫,并基于大語言模型從指令命令多語言描述庫中匹配語言描述內(nèi)容對應(yīng)的文字指令,并將文字指令按照執(zhí)行順序進行排序。
6、在一種實施方式中,基于設(shè)備垂直領(lǐng)域模型匹配文字指令對應(yīng)的設(shè)備操作協(xié)議指令,包括:按照文字指令的執(zhí)行順序,基于設(shè)備垂直領(lǐng)域模型匹配文字指令對應(yīng)的設(shè)備操作協(xié)議指令,并將設(shè)備操作協(xié)議指令按照執(zhí)行順序進行排序。
7、在一種實施方式中,將設(shè)備操作協(xié)議指令返回至智能穿戴設(shè)備,以使智能穿戴設(shè)備執(zhí)行對應(yīng)的設(shè)備操作,包括:將設(shè)備操作協(xié)議指令按照執(zhí)行順序封裝至app端,以使app端將設(shè)備操作協(xié)議指令通過藍牙發(fā)送至智能穿戴設(shè)備,并通過智能穿戴設(shè)備對設(shè)備操作協(xié)議指令進行識別,并執(zhí)行對應(yīng)的設(shè)備操作。
8、在一種實施方式中,將文字指令按照執(zhí)行順序進行排序之后,還包括:將文字指令和用戶輸入的音頻數(shù)據(jù)轉(zhuǎn)換得到的文本信息保存至歷史消息管道中。
9、在一種實施方式中,獲取用戶通過智能穿戴設(shè)備輸入的音頻數(shù)據(jù),并將音頻數(shù)據(jù)轉(zhuǎn)換成文本信息,包括:在智能穿戴設(shè)備開啟ai智能控制功能后,接收用戶輸入的音頻數(shù)據(jù),并將音頻數(shù)據(jù)保存為第一格式,將第一格式的音頻數(shù)據(jù)發(fā)送至app端;通過app端將第一格式的音頻數(shù)據(jù)轉(zhuǎn)換為第二格式,并將第二格式的音頻數(shù)據(jù)、用戶信息和智能穿戴設(shè)備的設(shè)備信息通過https表單請求發(fā)送至服務(wù)器端;通過服務(wù)器端調(diào)用文字識別接口,將第二格式的音頻數(shù)據(jù)轉(zhuǎn)換為文本信息。
10、第二方面,本發(fā)明實施例提供了一種語音控制設(shè)備的裝置,包括:音頻獲取模塊,用于獲取用戶通過智能穿戴設(shè)備輸入的音頻數(shù)據(jù),并將音頻數(shù)據(jù)轉(zhuǎn)換成文本信息;其中,音頻數(shù)據(jù)用于描述要控制智能穿戴設(shè)備執(zhí)行的操作內(nèi)容;指令獲取模塊,用于基于大語言模型對文本信息進行內(nèi)容識別得到控制智能穿戴設(shè)備的文字指令,并將文字指令發(fā)送至預(yù)先訓(xùn)練的設(shè)備垂直領(lǐng)域模型,基于設(shè)備垂直領(lǐng)域模型匹配文字指令對應(yīng)的設(shè)備操作協(xié)議指令;指令執(zhí)行模塊,用于將設(shè)備操作協(xié)議指令返回至智能穿戴設(shè)備,以使智能穿戴設(shè)備執(zhí)行對應(yīng)的設(shè)備操作。
11、第三方面,本發(fā)明實施例提供了一種電子設(shè)備,包括處理器和存儲器,存儲器存儲有能夠被處理器執(zhí)行的計算機可執(zhí)行指令,處理器執(zhí)行計算機可執(zhí)行指令以實現(xiàn)上述第一方面提供的任一項的方法的步驟。
12、第四方面,本發(fā)明實施例提供了一種計算機可讀存儲介質(zhì),計算機可讀存儲介質(zhì)上存儲有計算機程序,計算機程序被處理器運行時執(zhí)行上述第一方面提供的任一項的方法的步驟。
13、本發(fā)明實施例帶來了以下有益效果:
14、本發(fā)明實施例提供的上述語音控制設(shè)備的方法、裝置、電子設(shè)備及介質(zhì),首先獲取用戶通過智能穿戴設(shè)備輸入的音頻數(shù)據(jù)(用于描述要控制智能穿戴設(shè)備執(zhí)行的操作內(nèi)容),并將音頻數(shù)據(jù)轉(zhuǎn)換成文本信息;然后基于大語言模型對文本信息進行內(nèi)容識別得到控制智能穿戴設(shè)備的文字指令,并將文字指令發(fā)送至預(yù)先訓(xùn)練的設(shè)備垂直領(lǐng)域模型,基于設(shè)備垂直領(lǐng)域模型匹配文字指令對應(yīng)的設(shè)備操作協(xié)議指令;最后將設(shè)備操作協(xié)議指令返回至智能穿戴設(shè)備,以使智能穿戴設(shè)備執(zhí)行對應(yīng)的設(shè)備操作。上述方法中用戶可以通過在智能穿戴設(shè)備輸入音頻數(shù)據(jù),描述對智能穿戴設(shè)備的操作需求,并利用大語言模型對用戶需求進行精準識別確定用戶的操作行為的文字指令,并通過設(shè)備垂直領(lǐng)域模型將文字指令轉(zhuǎn)換為對應(yīng)的智能穿戴設(shè)備的設(shè)備操作協(xié)議指令,進行設(shè)備操作,從而提升了語音控制的識別準確率,進而提升了設(shè)備的智能性和用戶的體驗感。
15、本發(fā)明的其他特征和優(yōu)點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點在說明書、權(quán)利要求書以及附圖中所特別指出的結(jié)構(gòu)來實現(xiàn)和獲得。
16、為使本發(fā)明的上述目的、特征和優(yōu)點能更明顯易懂,下文特舉較佳實施例,并配合所附附圖,作詳細說明如下。
1.一種語音控制設(shè)備的方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,將所述音頻數(shù)據(jù)轉(zhuǎn)換成文本信息之后,還包括:
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,基于大語言模型對所述文本信息進行內(nèi)容識別得到控制所述智能穿戴設(shè)備的文字指令,包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,基于所述設(shè)備垂直領(lǐng)域模型匹配所述文字指令對應(yīng)的設(shè)備操作協(xié)議指令,包括:
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,將所述設(shè)備操作協(xié)議指令返回至所述智能穿戴設(shè)備,以使所述智能穿戴設(shè)備執(zhí)行對應(yīng)的設(shè)備操作,包括:
6.根據(jù)權(quán)利要求3所述的方法,其特征在于,將所述文字指令按照執(zhí)行順序進行排序之后,還包括:
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,
8.一種語音控制設(shè)備的裝置,其特征在于,包括:
9.一種電子設(shè)備,其特征在于,包括處理器和存儲器,所述存儲器存儲有能夠被所述處理器執(zhí)行的計算機可執(zhí)行指令,所述處理器執(zhí)行所述計算機可執(zhí)行指令以實現(xiàn)權(quán)利要求1至7任一項所述的方法的步驟。
10.一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)上存儲有計算機程序,其特征在于,所述計算機程序被處理器運行時執(zhí)行上述權(quán)利要求1至7任一項所述的方法的步驟。