本技術(shù)涉及計算機,尤其涉及一種問答方法、電子設(shè)備及存儲介質(zhì)。
背景技術(shù):
1、對于目前的問答方法來說,通??梢詫ξ谋緮?shù)據(jù)進行檢索,或通過知識圖譜以及直接生成文本等方式確定問題的回答;然而,這些方式仍然存在一定的局限性,例如可能受限于檢索的內(nèi)容和知識圖譜的覆蓋限制,而導致回答的準確性較低或可靠性較差的問題;由此可見,如何提升問答的準確性和可靠性是目前亟待解決的技術(shù)問題。
技術(shù)實現(xiàn)思路
1、本技術(shù)實施例提供了一種問答方法、電子設(shè)備及存儲介質(zhì),能夠有效提升問答的準確性和可靠性。
2、本技術(shù)實施例的技術(shù)方案是這樣實現(xiàn)的:
3、第一方面,本技術(shù)實施例提供了一種問答方法,方法包括:
4、響應(yīng)于問題請求,基于預設(shè)數(shù)據(jù)庫中的數(shù)據(jù)對問題請求進行問題的召回處理,得到第一問題信息;其中,預設(shè)數(shù)據(jù)庫用于提供召回處理的數(shù)據(jù);預設(shè)數(shù)據(jù)庫是通過獲取待處理文檔數(shù)據(jù),對待處理文檔數(shù)據(jù)進行數(shù)據(jù)清洗處理,得到處理后的文檔數(shù)據(jù),并基于處理后的文檔數(shù)據(jù)構(gòu)建的;數(shù)據(jù)清洗處理用于去除待處理文檔數(shù)據(jù)中的錯誤數(shù)據(jù);
5、在第一問題信息中存在第二問題信息的情況下,確定第二問題信息是否為第一數(shù)據(jù)來源中的問題信息;其中,第二問題信息表征第一問題信息中,第一相關(guān)性參數(shù)大于第一閾值的問題信息;第一相關(guān)性參數(shù)表征第一問題信息與問題請求之間的相關(guān)性的參數(shù);第一數(shù)據(jù)來源表征預設(shè)數(shù)據(jù)庫中的問答對數(shù)據(jù);
6、在第二問題信息為第一數(shù)據(jù)來源中的問題信息的情況下,將第二問題信息對應(yīng)的回答信息確定為問題請求的回答數(shù)據(jù)。
7、在本實施例中,電子設(shè)備可以在接收到問題請求的情況下,先利用預設(shè)數(shù)據(jù)庫中的數(shù)據(jù)對問題請求進行問題的召回處理,得到與問題請求相關(guān)的第一問題信息,然后在第一問題信息中選擇第一相關(guān)性參數(shù)大于第一閾值的第二問題信息,如果第一問題信息中存在符合條件的第二問題信息,則可以繼續(xù)確定這些第二問題信息是否來自于預設(shè)數(shù)據(jù)庫中的問答對數(shù)據(jù),如果是,則可以直接將第二問題信息對應(yīng)的回答信息作為回答數(shù)據(jù)輸出,由此通過構(gòu)建的預設(shè)數(shù)據(jù)庫,配合問題的召回處理,可以極大地提升問答的準確性和可靠性;另外,可以通過獲取不同領(lǐng)域的待處理文檔數(shù)據(jù)并進行相關(guān)的數(shù)據(jù)處理,由此構(gòu)建預設(shè)數(shù)據(jù)庫,能夠提升預設(shè)數(shù)據(jù)庫所能覆蓋的知識面,從而增強問答方法在不同領(lǐng)域的應(yīng)用效果。
8、在本技術(shù)的一些實施例中,方法還包括:
9、在第一問題信息中不存在第二問題信息的情況下,基于問題請求和預設(shè)數(shù)據(jù)庫中的文檔數(shù)據(jù)進行相關(guān)性評估處理,以確定第三問題信息;其中,第三問題信息表征基于文檔數(shù)據(jù)生成的與問題請求的相關(guān)性符合第一相關(guān)性條件的問題信息;
10、在第三問題信息中存在第四問題信息的情況下,對第四問題信息進行重排序處理,得到重排序的問題信息,并基于重排序的問題信息確定回答數(shù)據(jù);其中,第四問題信息表征第三問題信息中與問題請求之間的相似度大于第二閾值的問題信息。
11、在本實施例中,還可以在第一問題信息中不存在第二問題信息的情況下,基于問題請求和預設(shè)數(shù)據(jù)庫中的文檔數(shù)據(jù)進行相關(guān)性評估處理,以基于文檔數(shù)據(jù)和問題請求信息生成第三問題信息,進而判斷第三問題信息中是否存在與問題請求之間的相似度大于第二閾值的第四問題信息,如果存在,則可以對第四問題信息進行重排序,并基于重排序的問題信息來確定回答數(shù)據(jù),能夠提升問答的準確性。
12、在本技術(shù)的一些實施例中,基于重排序的問題信息確定回答數(shù)據(jù),包括:
13、確定重排序的問題信息中是否存在第五問題信息;其中,第五問題信息表征重排序的問題信息,第二相關(guān)性參數(shù)大于第三閾值的問題信息,第二相關(guān)性參數(shù)表征重排序后的問題信息與問題請求之間的相關(guān)性的參數(shù);
14、在重排序后的問題信息中存在第五問題信息的情況下,基于第五問題信息進行文檔的召回處理,以確定回答數(shù)據(jù)。
15、在本實施例中,可以確定重排序的問題信息中是否存在第二相關(guān)性參數(shù)大于第三閾值的問題信息的第五問題信息,如果存在,則可以基于第五問題信息進行文檔的召回處理以獲得回答數(shù)據(jù),能夠極大地提升問答的準確性。
16、在本技術(shù)的一些實施例中,方法還包括:
17、在重排序后的問題信息中不存在第五問題信息的情況下,基于第一語言模型、問題請求以及歷史交互數(shù)據(jù)確定回答數(shù)據(jù)。
18、在本實施例中,可以將第一語言模型作為兜底策略,可以在重排序后的問題信息中不存在第五問題信息的情況下,基于第一語言模型和問題請求以及歷史交互數(shù)據(jù)生成回答數(shù)據(jù),提升回答的全面性和準確性。
19、在本技術(shù)的一些實施例中,方法還包括:
20、在第三問題信息中不存在第四問題信息的情況下,基于第一語言模型、問題請求以及歷史交互數(shù)據(jù)確定回答數(shù)據(jù)。
21、在本實施例中,還可以在第三問題信息中不存在第四問題信息不存在第四問題信息的情況下,基于第一語言模型和問題請求以及歷史交互數(shù)據(jù)生成回答數(shù)據(jù),由此可以提升回答的全面性和準確性。
22、在本技術(shù)的一些實施例中,預設(shè)數(shù)據(jù)庫包括第一數(shù)據(jù)庫和第二數(shù)據(jù)庫;第一問題信息包括第六問題信息和第七問題信息;基于預設(shè)數(shù)據(jù)庫中的數(shù)據(jù)對問題請求進行問題的召回處理,得到第一問題信息,包括:
23、對第一數(shù)據(jù)庫中存儲的問答對數(shù)據(jù)和文檔與查詢數(shù)據(jù)中的問題數(shù)據(jù),與問題請求進行相似度計算,得到第一相似度結(jié)果,并基于第一相似度結(jié)果從問題數(shù)據(jù)中確定第六問題信息;
24、對問題請求進行向量化處理,得到向量化的問題請求;
25、對向量化的問題數(shù)據(jù)與向量化的問題請求進行相似度計算,得到第二相似度結(jié)果,并根據(jù)第二相似度結(jié)果從向量化的問題數(shù)據(jù)中確定第七問題信息;其中,向量化的問題數(shù)據(jù)是根據(jù)第二數(shù)據(jù)庫中存儲的向量化的問答對數(shù)據(jù)和向量化的文檔與查詢數(shù)據(jù)獲取的。
26、在本實施例中,預設(shè)數(shù)據(jù)庫中可以包括第一數(shù)據(jù)庫和第二數(shù)據(jù)庫,第一數(shù)據(jù)庫可以用于存儲問答對數(shù)據(jù)和文檔與查詢數(shù)據(jù),第二數(shù)據(jù)庫可以用于存儲向量化的問答對數(shù)據(jù)和向量化的文檔與查詢數(shù)據(jù);在進行問題的召回處理獲取第一問題信息時,電子設(shè)備可以分別基于第一數(shù)據(jù)庫和問題請求進行相似度計算以確定第六問題信息,同時在對問題請求進行向量化處理以后,基于第二數(shù)據(jù)庫和向量化的問題請求進行相似度計算以確定第七問題信息,由此通過同時在第一數(shù)據(jù)庫和第二數(shù)據(jù)庫進行問題的召回,能夠有效提升問題召回的可靠性,從而提升問答的可靠性。
27、在本技術(shù)的一些實施例中,基于第一相似度結(jié)果從問題數(shù)據(jù)中確定第六問題信息,包括:
28、基于第一相似度結(jié)果從問題數(shù)據(jù)中選擇第一數(shù)量的第八問題信息;
29、對第八問題信息進行向量化處理,得到向量化的第八問題信息;
30、對向量化的第八問題信息與向量化的問題請求進行相似度計算,得到第三相似度結(jié)果,將第三相似度結(jié)果中相似度信息大于第四閾值的問題信息確定為第六問題信息。
31、在本實施例中,在確定第六問題信息時,可以先根據(jù)第一相似度結(jié)果從問題數(shù)據(jù)中選擇第一數(shù)量的第八問題信息,然后對第八問題信息進行向量化處理,以利用向量化的第八問題信息與向量化的問題請求進行相似度計算,從而根據(jù)得到的第三相似度結(jié)果選擇出第六問題信息,由此能夠令選擇出的第六問題信息與問題請求之間具有較高的相似度,從而提升回答的準確性。
32、在本技術(shù)的一些實施例中,方法還包括:
33、在第二問題信息不為第一數(shù)據(jù)來源中的問題信息的情況下,基于第二問題信息進行文檔的召回處理,以確定回答數(shù)據(jù)。
34、在本實施例中,如果第二問題信息不是來自于預設(shè)數(shù)據(jù)庫中的問答對數(shù)據(jù),則繼續(xù)基于第二問題信息進行文檔的召回處理,以確定回答數(shù)據(jù),由此能夠在問題的召回處理的基礎(chǔ)上,結(jié)合文檔的召回處理,提升問答的準確性和可靠性。
35、在本技術(shù)的一些實施例中,基于第二問題信息進行文檔的召回處理,以確定回答數(shù)據(jù),包括:
36、基于第二問題信息對應(yīng)的文檔單元進行上下文擴充處理,得到擴充后的文檔單元;
37、基于第二語言模型對擴充后的文檔單元和問題請求進行分析處理,得到回答數(shù)據(jù)。
38、在本實施例中,在基于第二問題信息進行文檔的召回處理時,可以先基于第二問題信息對應(yīng)的文檔單元進行上下文擴充處理,以擴充后續(xù)基于第二語言模型進行分析處理的相關(guān)文檔單元,從而利用第二語言模型對擴充后的文檔單元和問題請求進行分析處理得到回答數(shù)據(jù),能夠有效提升回答的可靠性和準確性。
39、在本技術(shù)的一些實施例中,預設(shè)數(shù)據(jù)庫包括第三數(shù)據(jù)庫;基于處理后的文檔數(shù)據(jù)構(gòu)建預設(shè)數(shù)據(jù)庫,包括:
40、基于處理后的文檔數(shù)據(jù)的格式對處理后的文檔數(shù)據(jù)進行文檔切分處理,得到處理后的文檔數(shù)據(jù)對應(yīng)的文檔單元;
41、將文檔單元和文檔單元的第一信息存儲至第一數(shù)據(jù)庫;其中,第一信息包括文檔單元的來源信息、作者信息以及日期信息中的至少一種;
42、將處理后的文檔數(shù)據(jù)存儲至第三數(shù)據(jù)庫,以完成預設(shè)數(shù)據(jù)庫的構(gòu)建。
43、在本實施例中,可以按照處理后的文檔數(shù)據(jù)的格式對處理后的文檔數(shù)據(jù)進行文檔切分處理,得到對應(yīng)的文檔單元,然后將文檔單元和文檔單元的第一信息存儲至第一數(shù)據(jù)庫,同時將處理后的文檔數(shù)據(jù)存儲至第三數(shù)據(jù)庫,以完成預設(shè)數(shù)據(jù)庫的構(gòu)建。
44、在本技術(shù)的一些實施例中,預設(shè)數(shù)據(jù)庫還包括第四數(shù)據(jù)庫;方法還包括:
45、生成處理后的文檔數(shù)據(jù)對應(yīng)的第一密碼;
46、按照第一密碼將處理后的文檔數(shù)據(jù)對應(yīng)的文檔單元,和文檔單元在處理后的文檔數(shù)據(jù)中的上下文信息存儲至第四數(shù)據(jù)庫。
47、在本實施例中,可以將每個文檔數(shù)據(jù)對應(yīng)的文檔單元按照統(tǒng)一的第一密碼存儲至第四數(shù)據(jù)庫,從而可以提升對第四數(shù)據(jù)庫中文檔單元的可追溯性,提升預設(shè)數(shù)據(jù)庫的后處理能力。
48、在本技術(shù)的一些實施例中,方法還包括:
49、獲取問答對數(shù)據(jù);
50、基于預設(shè)擴展模型對問答對數(shù)據(jù)進行擴展處理,得到擴展后的問答對數(shù)據(jù);其中,擴展處理包括語義擴展處理、同義詞替換處理以及意圖識別處理中的至少一種;
51、將擴展后的問答對數(shù)據(jù)存儲至第一數(shù)據(jù)庫。
52、在本實施例中,可以獲取不同領(lǐng)域的問答對數(shù)據(jù),然后對問答對數(shù)據(jù)進行語義擴展處理、同義詞替換處理以及意圖識別處理中的至少一種,從而能夠提升問答對數(shù)據(jù)在語義上的豐富度,由此構(gòu)建的預設(shè)數(shù)據(jù)庫能夠提升后續(xù)問答的準確性。
53、在本技術(shù)的一些實施例中,方法還包括:
54、利用第一語言模型對文檔單元進行查詢提取處理,得到文檔單元對應(yīng)的查詢數(shù)據(jù);
55、根據(jù)文檔單元和查詢數(shù)據(jù)構(gòu)成文檔與查詢數(shù)據(jù),并將文檔與查詢數(shù)據(jù)存儲至第一數(shù)據(jù)庫。
56、在本實施例中,在獲取文檔與查詢數(shù)據(jù)時,可以利用第一語言模型對切分處理后獲得的文檔單元進行查詢提取處理,能夠得到各個文檔單元潛在的查詢數(shù)據(jù),并基于文檔單元和對應(yīng)的查詢數(shù)據(jù)構(gòu)成文檔與查詢數(shù)據(jù)進行存儲,能夠增強對文檔單元的理解和匹配能力,提升對復雜文檔進行處理時的靈活性和準確性。
57、第二方面,本技術(shù)實施例提供了一種電子設(shè)備,電子設(shè)備包括第一召回單元和確定單元;
58、第一召回單元,用于響應(yīng)于問題請求,基于預設(shè)數(shù)據(jù)庫中的數(shù)據(jù)對問題請求進行問題的召回處理,得到第一問題信息;預設(shè)數(shù)據(jù)庫是通過獲取待處理文檔數(shù)據(jù),對待處理文檔數(shù)據(jù)進行數(shù)據(jù)清洗處理,得到處理后的文檔數(shù)據(jù),并基于處理后的文檔數(shù)據(jù)構(gòu)建的;數(shù)據(jù)清洗處理用于去除待處理文檔數(shù)據(jù)中的錯誤數(shù)據(jù);
59、確定單元,用于在第一問題信息中存在第二問題信息的情況下,確定第二問題信息是否為第一數(shù)據(jù)來源中的問題信息;其中,第二問題信息表征第一問題信息中,第一相關(guān)性參數(shù)大于第一閾值的問題信息;第一相關(guān)性參數(shù)表征第一問題信息與問題請求之間的相關(guān)性的參數(shù);第一數(shù)據(jù)來源表征預設(shè)數(shù)據(jù)庫中的問答對數(shù)據(jù);以及在第二問題信息為第一數(shù)據(jù)來源中的問題信息的情況下,將第二問題信息對應(yīng)的回答信息確定為問題請求的回答數(shù)據(jù)。
60、在本實施例中,電子設(shè)備可以在接收到問題請求的情況下,先利用預設(shè)數(shù)據(jù)庫中的數(shù)據(jù)對問題請求進行問題的召回處理,得到與問題請求相關(guān)的第一問題信息,然后在第一問題信息中選擇第一相關(guān)性參數(shù)大于第一閾值的第二問題信息,如果第一問題信息中存在符合條件的第二問題信息,則可以繼續(xù)確定這些第二問題信息是否來自于預設(shè)數(shù)據(jù)庫中的問答對數(shù)據(jù),如果是,則可以直接將第二問題信息對應(yīng)的回答信息作為回答數(shù)據(jù)輸出,由此通過構(gòu)建的預設(shè)數(shù)據(jù)庫,配合問題的召回處理可以極大地提升問答的準確性和可靠性。
61、第三方面,本技術(shù)實施例提供了一種電子設(shè)備,包括處理器、存儲有處理器可執(zhí)行指令的存儲器;當指令被處理器執(zhí)行時,實現(xiàn)上述問答方法。
62、第四方面,本技術(shù)實施例提供了一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,計算機程序被處理器執(zhí)行時,實現(xiàn)上述問答方法。