本公開(kāi)涉及計(jì)算機(jī),尤其涉及一種智能問(wèn)答方法、設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、工業(yè)界基于知識(shí)圖譜的智能問(wèn)答大多數(shù)側(cè)重于簡(jiǎn)單問(wèn)題的回答,而對(duì)于較為復(fù)雜的多跳問(wèn)題,當(dāng)前基于知識(shí)庫(kù)的問(wèn)答(knowledge?base?question?answering,kbqa)解決方案大多為對(duì)問(wèn)題進(jìn)行關(guān)系抽取時(shí),多跳問(wèn)題的多種關(guān)系拼接為新的關(guān)系標(biāo)簽,從而利用模型進(jìn)行多跳關(guān)系識(shí)別,最終將多跳關(guān)系拆分再結(jié)合實(shí)體進(jìn)行圖庫(kù)查詢操作。但隨著知識(shí)庫(kù)不斷增大,關(guān)系數(shù)量愈發(fā)增多以及面臨更加復(fù)雜的三跳問(wèn)題時(shí),上述方案產(chǎn)生的數(shù)據(jù)成本便成指數(shù)增加,并且覆蓋率也會(huì)降低。
技術(shù)實(shí)現(xiàn)思路
1、本公開(kāi)的第一方面實(shí)施例提出了一種智能問(wèn)答方法,該方法包括:基于多分類模型對(duì)輸入問(wèn)題進(jìn)行單多跳類別的劃分,獲取輸入問(wèn)題的單多跳類別;提取輸入問(wèn)題的特征實(shí)體,并將特征實(shí)體與知識(shí)庫(kù)中的實(shí)體進(jìn)行實(shí)體鏈接以確定鏈接實(shí)體;根據(jù)輸入問(wèn)題的單多跳類別和鏈接實(shí)體,從知識(shí)庫(kù)中召回候選子圖;基于孿生網(wǎng)絡(luò)架構(gòu)的預(yù)訓(xùn)練模型對(duì)候選子圖和輸入問(wèn)題進(jìn)行文本相似度匹配,確定相似度最高的候選子圖,并將相似度最高的候選子圖作為輸入問(wèn)題的答案輸出。
2、在本公開(kāi)的一些實(shí)施例中,基于多分類模型對(duì)輸入問(wèn)題進(jìn)行單多跳類別的劃分,獲取輸入問(wèn)題的單多跳類別包括:通過(guò)查詢字向量表將輸入問(wèn)題中的每個(gè)字轉(zhuǎn)換為一維向量;將一維向量與輸入問(wèn)題的段落向量和位置向量進(jìn)行相加,得到輸入序列;通過(guò)預(yù)設(shè)層數(shù)的編碼器提取輸入序列中的特征獲取輸出序列,并通過(guò)全連接層對(duì)輸出序列進(jìn)行整合得到輸出結(jié)果;將輸出結(jié)果輸入多分類函數(shù)以獲取類別概率值,其中,類別概率值包括輸入問(wèn)題的每種單多跳類別的概率值;基于類別概率值,確定輸入問(wèn)題的單多跳類別。
3、在本公開(kāi)的一些實(shí)施例中,提取輸入問(wèn)題的特征實(shí)體包括:通過(guò)預(yù)訓(xùn)練模型生成輸入問(wèn)題的詞向量;利用雙向循環(huán)神經(jīng)網(wǎng)絡(luò)對(duì)輸入問(wèn)題的詞向量進(jìn)行特征提取以及標(biāo)簽分類,得到標(biāo)簽類別;將標(biāo)簽類別輸入條件隨機(jī)場(chǎng)模型計(jì)算標(biāo)簽序列;采用動(dòng)態(tài)規(guī)劃算法對(duì)標(biāo)簽序列進(jìn)行解碼,求取標(biāo)簽序列中概率最大的標(biāo)簽序列,并將概率最大的標(biāo)簽序列確定為輸入問(wèn)題的特征實(shí)體。
4、在本公開(kāi)的一些實(shí)施例中,將特征實(shí)體與知識(shí)庫(kù)中的實(shí)體進(jìn)行實(shí)體鏈接以確定鏈接實(shí)體包括:通過(guò)對(duì)特征實(shí)體進(jìn)行字符串匹配,從知識(shí)庫(kù)中匹配得到候選實(shí)體集合;對(duì)特征實(shí)體和候選實(shí)體集合進(jìn)行實(shí)體消歧處理,獲取候選實(shí)體集合中的候選實(shí)體與輸入問(wèn)題的語(yǔ)義相似度,將候選實(shí)體集合中與語(yǔ)義相似度最高的候選實(shí)體確定為鏈接實(shí)體。
5、在本公開(kāi)的一些實(shí)施例中,通過(guò)對(duì)特征實(shí)體進(jìn)行字符串匹配,從知識(shí)庫(kù)中匹配得到候選實(shí)體集合包括:對(duì)特征實(shí)體進(jìn)行分詞處理,得到分詞結(jié)果集合;為分詞結(jié)果集合中的各個(gè)分詞結(jié)果分配權(quán)重,獲取各個(gè)分詞結(jié)果的權(quán)重;遍歷分詞結(jié)果集合中的所有分詞結(jié)果,針對(duì)每一個(gè)分詞結(jié)果,從知識(shí)庫(kù)中進(jìn)行匹配查找候選實(shí)體,其中,分詞結(jié)果和候選實(shí)體一一對(duì)應(yīng),候選實(shí)體的權(quán)重為其對(duì)應(yīng)的分詞結(jié)果的權(quán)重。
6、在本公開(kāi)的一些實(shí)施例中,根據(jù)輸入問(wèn)題的單多跳類別和鏈接實(shí)體,從知識(shí)庫(kù)中召回候選子圖包括:從知識(shí)庫(kù)中篩選出與輸入問(wèn)題的單多跳類別相同的第一子圖,其中,單多跳類別包括一跳、二跳及三跳;從第一子圖中召回頂點(diǎn)為鏈接實(shí)體的第二子圖,將第二子圖確定為候選子圖。
7、在本公開(kāi)的一些實(shí)施例中,基于孿生網(wǎng)絡(luò)架構(gòu)的預(yù)訓(xùn)練模型對(duì)候選子圖和輸入問(wèn)題進(jìn)行文本相似度匹配,確定相似度最高的候選子圖,并將相似度最高的候選子圖作為輸入問(wèn)題的答案輸出包括:針對(duì)每一個(gè)候選子圖,將候選子圖的路徑和輸入問(wèn)題同時(shí)輸入相同的預(yù)訓(xùn)練模型進(jìn)行處理,輸出第一語(yǔ)句向量和第二語(yǔ)句向量,其中,候選子圖的路徑為候選子圖中所有節(jié)點(diǎn)之間的連線;對(duì)第一語(yǔ)句向量和第二語(yǔ)句向量進(jìn)行平均池化處理,得到第一向量和第二向量;計(jì)算第一向量和第二向量的相似度,得到候選子圖的路徑的相似度;遍歷所有候選子圖,將相似度最高的候選子圖的路徑作為輸入問(wèn)題的答案路徑輸出。
8、本公開(kāi)的第二方面實(shí)施例提出了一種智能問(wèn)答裝置,該裝置包括:多分類模塊,用于基于多分類模型對(duì)輸入問(wèn)題進(jìn)行單多跳類別的劃分,獲取輸入問(wèn)題的單多跳類別;實(shí)體鏈接模塊,用于提取輸入問(wèn)題的特征實(shí)體,并將特征實(shí)體與知識(shí)庫(kù)中的實(shí)體進(jìn)行實(shí)體鏈接以確定鏈接實(shí)體;召回模塊,用于根據(jù)輸入問(wèn)題的單多跳類別和鏈接實(shí)體,從知識(shí)庫(kù)中召回候選子圖;排序模塊,用于基于孿生網(wǎng)絡(luò)架構(gòu)的預(yù)訓(xùn)練模型對(duì)候選子圖和輸入問(wèn)題進(jìn)行文本相似度匹配,確定相似度最高的候選子圖,并將相似度最高的候選子圖作為輸入問(wèn)題的答案輸出。
9、本公開(kāi)的第三方面實(shí)施例提出了一種電子設(shè)備,包括:至少一個(gè)處理器;以及與至少一個(gè)處理器連接的存儲(chǔ)器;其中,存儲(chǔ)器存儲(chǔ)有可被至少一個(gè)處理器執(zhí)行的指令,指令被至少一個(gè)處理器執(zhí)行,以使至少一個(gè)處理器能夠執(zhí)行本公開(kāi)第一方面實(shí)施例中描述的方法。
10、本公開(kāi)的第四方面實(shí)施例提出了一種存儲(chǔ)有計(jì)算機(jī)指令的非瞬時(shí)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中,計(jì)算機(jī)指令用于使計(jì)算機(jī)執(zhí)行本公開(kāi)第一方面實(shí)施例中描述的方法。
11、綜上,本公開(kāi)提出的智能問(wèn)答方法,包括基于多分類模型對(duì)輸入問(wèn)題進(jìn)行單多跳類別的劃分,獲取輸入問(wèn)題的單多跳類別;提取輸入問(wèn)題的特征實(shí)體,并將特征實(shí)體與知識(shí)庫(kù)中的實(shí)體進(jìn)行實(shí)體鏈接以確定鏈接實(shí)體;根據(jù)輸入問(wèn)題的單多跳類別和鏈接實(shí)體,從知識(shí)庫(kù)中召回候選子圖;對(duì)候選子圖和輸入問(wèn)題進(jìn)行文本相似度匹配,確定相似度最高的候選子圖,并將相似度最高的候選子圖作為輸入問(wèn)題的答案輸出,本公開(kāi)的方法利用多分類策略解決復(fù)雜多跳問(wèn)題,基于子圖匹配方法實(shí)現(xiàn)答案篩選排序,極大縮減復(fù)雜多跳問(wèn)題下的數(shù)據(jù)標(biāo)注及模型訓(xùn)練成本,對(duì)于基于知識(shí)圖譜的智能問(wèn)答領(lǐng)域在智能性和產(chǎn)品體驗(yàn)上具有較大的提升。
12、應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本公開(kāi)。
1.一種智能問(wèn)答方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于多分類模型對(duì)輸入問(wèn)題進(jìn)行單多跳類別的劃分,獲取所述輸入問(wèn)題的單多跳類別包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述提取所述輸入問(wèn)題的特征實(shí)體包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述將所述特征實(shí)體與知識(shí)庫(kù)中的實(shí)體進(jìn)行實(shí)體鏈接以確定鏈接實(shí)體包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述通過(guò)對(duì)所述特征實(shí)體進(jìn)行字符串匹配,從所述知識(shí)庫(kù)中匹配得到候選實(shí)體集合包括:
6.根據(jù)權(quán)利要求1-5任一項(xiàng)所述的方法,其特征在于,所述根據(jù)所述輸入問(wèn)題的單多跳類別和所述鏈接實(shí)體,從所述知識(shí)庫(kù)中召回候選子圖包括:
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述基于孿生網(wǎng)絡(luò)架構(gòu)的預(yù)訓(xùn)練模型對(duì)所述候選子圖的路徑和所述輸入問(wèn)題進(jìn)行文本相似度匹配,確定相似度最高的候選子圖,并將所述相似度最高的候選子圖作為所述輸入問(wèn)題的答案輸出包括:
8.一種智能問(wèn)答裝置,其特征在于,所述裝置包括:
9.一種電子設(shè)備,其特征在于,包括:
10.一種存儲(chǔ)有計(jì)算機(jī)指令的非瞬時(shí)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)指令用于使所述計(jì)算機(jī)執(zhí)行根據(jù)權(quán)利要求1至7中任一項(xiàng)所述的方法。