日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

油氣領(lǐng)域信息檢索方法、裝置及電子設(shè)備與流程

文檔序號(hào):39713024發(fā)布日期:2024-10-22 12:58閱讀:2來源:國知局
油氣領(lǐng)域信息檢索方法、裝置及電子設(shè)備與流程

本發(fā)明涉及計(jì)算機(jī),具體地涉及一種油氣領(lǐng)域信息檢索方法、一種油氣領(lǐng)域信息檢索裝置、一種電子設(shè)備和一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。


背景技術(shù):

1、在油氣領(lǐng)域,存在大量的行業(yè)知識(shí)和行業(yè)文檔組成的文檔庫,而對(duì)于油氣勘探開發(fā)工作者來說,查閱資料是日常工作的很重要的一環(huán)。在過去,基本只能通過關(guān)鍵詞檢索的來檢索文檔,有些對(duì)于模糊的概念沒有形成關(guān)鍵詞的,則難以得到想要的結(jié)果;對(duì)于文檔相似搜索的需求考慮的也比較少。

2、當(dāng)前,油氣領(lǐng)域知識(shí)搜索更多是基于elastic?search(簡(jiǎn)稱es)的關(guān)鍵詞搜索,將用戶輸入的關(guān)鍵詞進(jìn)行切詞,然后直接放入es中,依據(jù)tf-idf技術(shù)或者bm25技術(shù)進(jìn)行檢索。

3、當(dāng)前的現(xiàn)有技術(shù)存在以下問題:基于關(guān)鍵詞的檢索不能夠更精確的理解用戶的意圖,也不能夠?qū)?duì)應(yīng)的思維進(jìn)行相似維度上的拓展,對(duì)于油氣領(lǐng)域的知識(shí)工作者來說,需要經(jīng)過多次檢索,不斷調(diào)整關(guān)鍵詞才能搜索到真正需要的知識(shí)。


技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明的目的是提供一種油氣領(lǐng)域信息檢索方法、裝置及電子設(shè)備,通過提供更智能的檢索方法,兼顧了關(guān)鍵詞檢索、語義拓展檢索和段落相似檢索,滿足油氣領(lǐng)域知識(shí)工作者的多樣化的語義檢索需求,縮短油氣領(lǐng)域知識(shí)工作者獲取油氣領(lǐng)域信息的檢索路徑。

2、為了實(shí)現(xiàn)上述目的,本發(fā)明實(shí)施例提供一種方法,所述方法包括:

3、獲取檢索文本,所述檢索文本用于表征用戶輸入的、與油氣領(lǐng)域相關(guān)的語句;

4、通過開源工具對(duì)所述檢索文本進(jìn)行語法分析,得到分析結(jié)果,所述分析結(jié)果為所述檢索文本包含主謂關(guān)系或所述檢索文本不包含主謂關(guān)系;

5、通過第一模型,根據(jù)所述分析結(jié)果對(duì)應(yīng)的檢索文本生成檢索文本向量,所述第一模型用于對(duì)所述檢索文本進(jìn)行特征提取處理;

6、根據(jù)所述檢索文本向量以及預(yù)先設(shè)定的閾值,通過預(yù)先設(shè)置的第一向量庫進(jìn)行余弦相似度檢索,得到返回文本;

7、若所述檢索文本包含主謂關(guān)系,則根據(jù)所述返回文本定位所述返回文本對(duì)應(yīng)的技術(shù)文檔,得到目標(biāo)檢索結(jié)果;若所述檢索文本不包含主謂關(guān)系,則通過預(yù)先設(shè)置的第一數(shù)據(jù)庫,根據(jù)所述返回文本、所述返回文本對(duì)應(yīng)的檢索文本、預(yù)先設(shè)定的權(quán)重分配規(guī)則以及bm25評(píng)分規(guī)則,得到所述目標(biāo)檢索結(jié)果。

8、具體的,在所述獲取檢索文本之前,所述方法還包括:

9、獲取技術(shù)文檔,所述技術(shù)文檔用于表征油氣領(lǐng)域的相關(guān)信息;

10、將所述技術(shù)文檔存儲(chǔ)至elasticsearch數(shù)據(jù)庫;

11、將所述技術(shù)文檔聚合成技術(shù)段落,將所述技術(shù)文檔與所述技術(shù)段落之間的映射關(guān)系存儲(chǔ)至關(guān)系型數(shù)據(jù)庫中;

12、通過fasttext模型,根據(jù)所述技術(shù)文檔中的關(guān)鍵詞生成第一原始向量;

13、通過transformers模型,根據(jù)所述技術(shù)段落生成第二原始向量;

14、獲取所述第一向量庫,所述第一向量庫用于存儲(chǔ)所述第一原始向量和所述第二原始向量。

15、具體的,所述分析結(jié)果為所述檢索文本包含主謂關(guān)系,所述第一模型為sbert模型;

16、所述通過第一模型,根據(jù)所述分析結(jié)果對(duì)應(yīng)的檢索文本生成檢索文本向量,包括:

17、通過所述sbert模型,根據(jù)所述分析結(jié)果對(duì)應(yīng)的檢索文本生成所述檢索文本向量。

18、具體的,所述分析結(jié)果為所述檢索文本不包含主謂關(guān)系,所述第一模型為關(guān)鍵詞向量化模型;

19、所述通過第一模型,根據(jù)所述分析結(jié)果對(duì)應(yīng)的檢索文本生成檢索文本向量,包括:

20、通過所述關(guān)鍵詞向量化模型,根據(jù)所述分析結(jié)果對(duì)應(yīng)的檢索文本生成所述檢索文本向量。

21、具體的,所述第一向量庫為段落向量庫,所述根據(jù)所述檢索文本向量以及預(yù)先設(shè)定的閾值,通過預(yù)先設(shè)置的第一向量庫進(jìn)行余弦相似度檢索,得到返回文本,包括:

22、根據(jù)所述檢索文本向量,通過所述段落向量庫進(jìn)行余弦相似度檢索,得到第一返回段落向量;

23、根據(jù)所述閾值,對(duì)所述第一返回段落向量進(jìn)行過濾處理,得到第二返回段落向量;

24、根據(jù)所述第二返回段落向量得到對(duì)應(yīng)的所述返回文本。

25、具體的,所述第一向量庫為關(guān)鍵詞向量庫,所述根據(jù)所述檢索文本向量以及預(yù)先設(shè)定的閾值,通過預(yù)先設(shè)置的第一向量庫進(jìn)行余弦相似度檢索,得到返回文本,包括:

26、根據(jù)所述檢索文本向量,通過所述關(guān)鍵詞向量庫進(jìn)行余弦相似度檢索,得到第一返回關(guān)鍵詞向量;

27、根據(jù)所述閾值,對(duì)所述第一返回關(guān)鍵詞向量進(jìn)行過濾處理,得到第二返回關(guān)鍵詞向量;

28、根據(jù)所述第二返回關(guān)鍵詞向量得到對(duì)應(yīng)的所述返回文本。

29、具體的,所述第一數(shù)據(jù)庫為所述elasticsearch數(shù)據(jù)庫,所述若所述檢索文本不包含主謂關(guān)系,則通過預(yù)先設(shè)置的第一數(shù)據(jù)庫,根據(jù)所述返回文本、所述返回文本對(duì)應(yīng)的檢索文本、預(yù)先設(shè)定的權(quán)重分配規(guī)則以及bm25評(píng)分規(guī)則,得到所述目標(biāo)檢索結(jié)果,包括:

30、將所述返回文本以及所述返回文本對(duì)應(yīng)的檢索文本返回至所述elasticsearch數(shù)據(jù)庫中進(jìn)行檢索,得到目標(biāo)返回結(jié)果;

31、通過所述權(quán)重分配規(guī)則以及bm25評(píng)分規(guī)則對(duì)所述目標(biāo)返回結(jié)果進(jìn)行轉(zhuǎn)化處理,得到所述目標(biāo)檢索結(jié)果。

32、另一方面,本發(fā)明實(shí)施例提供一種裝置,所述裝置包括:

33、檢索文本獲取單元,用于獲取檢索文本,所述檢索文本用于表征用戶輸入的、與油氣領(lǐng)域相關(guān)的語句;

34、語法分析單元,用于通過開源工具對(duì)所述檢索文本進(jìn)行語法分析,得到分析結(jié)果,所述分析結(jié)果為所述檢索文本包含主謂關(guān)系或所述檢索文本不包含主謂關(guān)系;

35、特征提取單元,用于通過第一模型,根據(jù)所述分析結(jié)果對(duì)應(yīng)的檢索文本生成檢索文本向量,所述第一模型用于對(duì)所述檢索文本進(jìn)行特征提取處理;

36、返回文本獲取單元,用于根據(jù)所述檢索文本向量以及預(yù)先設(shè)定的閾值,通過預(yù)先設(shè)置的第一向量庫進(jìn)行余弦相似度檢索,得到返回文本;

37、目標(biāo)檢索結(jié)果獲取單元,用于若所述檢索文本包含主謂關(guān)系,則根據(jù)所述返回文本定位所述返回文本對(duì)應(yīng)的技術(shù)文檔,得到目標(biāo)檢索結(jié)果;若所述檢索文本不包含主謂關(guān)系,則通過預(yù)先設(shè)置的第一數(shù)據(jù)庫,根據(jù)所述返回文本、所述返回文本對(duì)應(yīng)的檢索文本、預(yù)先設(shè)定的權(quán)重分配規(guī)則以及bm25評(píng)分規(guī)則,得到所述目標(biāo)檢索結(jié)果。

38、再一方面,本發(fā)明實(shí)施例提供一種電子設(shè)備,該電子設(shè)備包括:

39、至少一個(gè)處理器;

40、存儲(chǔ)器,與所述至少一個(gè)處理器連接;

41、其中,所述存儲(chǔ)器存儲(chǔ)有能被所述至少一個(gè)處理器執(zhí)行的指令,所述至少一個(gè)處理器通過執(zhí)行所述存儲(chǔ)器存儲(chǔ)的指令,所述至少一個(gè)處理器通過執(zhí)行所述存儲(chǔ)器存儲(chǔ)的指令實(shí)現(xiàn)前述的方法。

42、又一方面,本發(fā)明實(shí)施例提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),存儲(chǔ)有計(jì)算機(jī)指令,當(dāng)所述計(jì)算機(jī)指令在計(jì)算機(jī)上運(yùn)行時(shí),使得計(jì)算機(jī)執(zhí)行前述的方法。

43、本發(fā)明提供了更智能的檢索方法,兼顧關(guān)鍵詞檢索、語義拓展檢索和段落相似檢索,滿足油氣領(lǐng)域知識(shí)工作者的多樣化的語義檢索需求,縮短油氣領(lǐng)域知識(shí)工作者獲取油氣領(lǐng)域信息的檢索路徑。

44、本發(fā)明實(shí)施例的其它特征和優(yōu)點(diǎn)將在隨后的具體實(shí)施方式部分予以詳細(xì)說明。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1