本申請涉及人機交互領(lǐng)域,尤其涉及問答匹配增強方法、問答匹配增強裝置、電子設(shè)備及存儲介質(zhì)。
背景技術(shù):
1、在過去幾十年里,問答系統(tǒng)一直是學(xué)術(shù)界感興趣的話題,隨著人工智能的使用在全球范圍內(nèi)不斷增加,汽車也逐漸智能化,車輛問答系統(tǒng)也越來越受到用戶的喜愛。車輛問答包括系統(tǒng)控制、導(dǎo)航、娛樂、電話、閑聊等。車輛問答匹配的任務(wù)就是根據(jù)具體的問題,能夠給出準(zhǔn)確的回答。在汽車領(lǐng)域中,用戶可以根據(jù)問答系統(tǒng),獲取想要的答案,減少手動操作,提升用戶體驗性。對于車輛問答系統(tǒng),提升問答的準(zhǔn)確性和用戶體驗感是非常重要的問題。
2、用戶提出的問題可能會存在一些歧義的單詞,這些單詞可能存在一詞多義、縮寫和簡寫等特征,消歧這些歧義單詞使用戶的問題更加明確對于增強問答匹配是非常重要的。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的在于提供一種問答匹配增強方法、裝置、電子設(shè)備及存儲介質(zhì),能夠解決問答中出現(xiàn)實體具有歧義的問題。
2、本發(fā)明提供了下述方案:
3、根據(jù)本發(fā)明的一個方面,提供一種問答匹配增強方法,所述問答匹配增強方法包括:
4、建立實體知識庫;
5、獲取用戶和車機的對話,利用深度學(xué)習(xí)的命名實體識別方法bert-bilst?m-crf識別出關(guān)鍵實體;
6、將關(guān)鍵實體的整體受歡迎程度作為評分函數(shù),選擇關(guān)鍵實體在實體知識庫中可能鏈接的實體;
7、使用局部特征對可能鏈接的實體進(jìn)行消歧;
8、使用全局特征對可能鏈接的實體進(jìn)行消歧。
9、可選的,建立實體知識庫,包括:
10、從車機用戶數(shù)據(jù)、電子手冊、汽車論壇收集數(shù)據(jù),將抽取的數(shù)據(jù)通過實體標(biāo)注的方式將所有數(shù)據(jù)分為多種類別;
11、對于數(shù)據(jù)進(jìn)行篩選過濾和清理,去除掉錯誤、無關(guān)和重復(fù)的數(shù)據(jù),建立實體知識庫。
12、可選的,將關(guān)鍵實體的整體受歡迎程度作為評分函數(shù),選擇關(guān)鍵實體在實體知識庫中可能鏈接的實體,包括:
13、通過可能鏈接實體的共性、作為關(guān)鍵實體的鏈接目標(biāo)的次數(shù),除以關(guān)鍵實體出現(xiàn)的總次數(shù),計算關(guān)鍵實體的整體受歡迎程度;
14、根據(jù)關(guān)鍵實體的整體受歡迎程度,選擇可能鏈接的實體。
15、可選的,使用全局特征對可能鏈接的實體進(jìn)行消歧,包括:
16、得到每個可能鏈接實體的條件概率得分;
17、根據(jù)條件概率得分選擇得分最高的前4位可能被鏈接的實體進(jìn)行訓(xùn)練。
18、可選的,訓(xùn)練模型用的目標(biāo)函數(shù)如下所示:
19、minl(θ)=l+μ||θ||2;
20、θ表示模型所有的輸入?yún)?shù),μ是訓(xùn)練損失l和正則化||θ||2之間的權(quán)衡參數(shù),μ取值1e-5。
21、可選的,根據(jù)條件概率得分選擇得分最高的前4位可能被鏈接的實體進(jìn)行訓(xùn)練,包括:
22、使用隨機梯度下降優(yōu)化模型。
23、可選的,訓(xùn)練損失l表示預(yù)測實體和真實實體之間的交叉熵?fù)p失。
24、根據(jù)本發(fā)明的二個方面,提供一種問答匹配增強裝置,所述問答匹配增強裝置包括:
25、建立模塊,用于建立實體知識庫;
26、識別模塊,用于獲取用戶和車機的對話,利用深度學(xué)習(xí)的命名實體識別方法bert-bilst?m-crf識別出關(guān)鍵實體;
27、選擇模塊,用于將關(guān)鍵實體的整體受歡迎程度作為評分函數(shù),選擇關(guān)鍵實體在實體知識庫中可能鏈接的實體;
28、第一消歧模塊,用于使用局部特征對可能鏈接的實體進(jìn)行消歧;
29、第二消歧模塊,用于使用全局特征對可能鏈接的實體進(jìn)行消歧。
30、根據(jù)本發(fā)明的三個方面,提供一種電子設(shè)備,包括:處理器、通信接口、存儲器和通信總線,其中,處理器,通信接口,存儲器通過通信總線完成相互間的通信;
31、所述存儲器中存儲有計算機程序,當(dāng)所述計算機程序被所述處理器執(zhí)行時,使得所述處理器執(zhí)行所述問答匹配增強方法的步驟。
32、根據(jù)本發(fā)明的四個方面,提供一種計算機可讀存儲介質(zhì),包括:其存儲有可由電子設(shè)備執(zhí)行的計算機程序,當(dāng)計算機程序在電子設(shè)備上運行時,使得電子設(shè)備執(zhí)行所述問答匹配增強方法的步驟。
33、通過上述方案,獲得如下有益的技術(shù)效果:
34、目前并沒有公開的車輛領(lǐng)域的知識庫,公開的數(shù)據(jù)集中涉及內(nèi)容比較廣泛,語義信息不足,數(shù)據(jù)噪音比較大。為了減少噪音,提高準(zhǔn)確性,從車機用戶數(shù)據(jù)中提取數(shù)據(jù)結(jié)合電子手冊和汽車論壇數(shù)據(jù)構(gòu)建知識庫;采用實體鏈接方法應(yīng)用于車輛問答匹配,解決實體的語義歧義問題;對于用戶提出的問題,消歧問題中包含的歧義單詞,減少歧義單詞導(dǎo)致的匹配不準(zhǔn)確問題。
1.一種問答匹配增強方法,其特征在于,所述問答匹配增強方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,建立實體知識庫,包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,將關(guān)鍵實體的整體受歡迎程度作為評分函數(shù),選擇關(guān)鍵實體在實體知識庫中可能鏈接的實體,包括:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,使用全局特征對可能鏈接的實體進(jìn)行消歧,包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,訓(xùn)練模型用的目標(biāo)函數(shù)如下所示:
6.根據(jù)權(quán)利要求4所述的方法,其特征在于,根據(jù)條件概率得分選擇得分最高的前4位可能被鏈接的實體進(jìn)行訓(xùn)練,包括:
7.根據(jù)權(quán)利要求5所述的方法,其特征在于,訓(xùn)練損失l表示預(yù)測實體和真實實體之間的交叉熵?fù)p失。
8.一種問答匹配增強裝置,其特征在于,所述問答匹配增強裝置包括:
9.一種電子設(shè)備,其特征在于,包括:處理器、通信接口、存儲器和通信總線,其中,處理器,通信接口、存儲器通過通信總線完成相互間的通信;所述存儲器中存儲有計算機程序,當(dāng)所述計算機程序被所述處理器執(zhí)行時,使得所述處理器執(zhí)行權(quán)利要去1至7中任一項所述方法的步驟。
10.一種計算機可讀存儲介質(zhì),其特征在于,其存儲有可由電子設(shè)備執(zhí)行的計算機程序,當(dāng)所述計算機程序在所述電子設(shè)備上運行時,使得所述電子設(shè)備執(zhí)行權(quán)利要求1至7中任一項所述方法的步驟。