本申請(qǐng)涉及知識(shí)圖譜構(gòu)建領(lǐng)域,具體涉及一種知識(shí)圖譜構(gòu)建方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)。
背景技術(shù):
1、現(xiàn)有反欺詐的方案存在如下技術(shù)缺點(diǎn):
2、1、在反欺詐內(nèi)容識(shí)別環(huán)節(jié),對(duì)新型欺詐內(nèi)容要素響應(yīng)不夠及時(shí),用于匹配的涉詐關(guān)鍵詞庫(kù)缺乏時(shí)效性。涉詐內(nèi)容的識(shí)別通常以關(guān)鍵詞為要素進(jìn)行判斷,而關(guān)鍵詞受制于語(yǔ)料的時(shí)效性。此外,關(guān)鍵詞庫(kù)體量增大后,更新成本增加,更新周期延長(zhǎng),造成詞庫(kù)落后。
3、2、在反欺詐監(jiān)測(cè)環(huán)節(jié),暫時(shí)缺乏全面監(jiān)測(cè)系統(tǒng),監(jiān)測(cè)信息來(lái)源不足,缺乏整體感知監(jiān)測(cè),關(guān)注點(diǎn)零散,缺乏有序組織。
4、3、在反欺詐決策制定環(huán)節(jié),知識(shí)支撐來(lái)源較少。反欺詐決策使用的數(shù)據(jù)和知識(shí)來(lái)源較為零散,部分反欺詐知識(shí)的主觀性較強(qiáng),支撐能力較弱。此外,由于知識(shí)組織形式的原因,用于支撐決策的反欺詐知識(shí)很難與其他領(lǐng)域的通用知識(shí)連接起來(lái)共同發(fā)揮支撐作用。
技術(shù)實(shí)現(xiàn)思路
1、本申請(qǐng)實(shí)施例提供一種知識(shí)圖譜構(gòu)建方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì),用以解決現(xiàn)有反欺詐的方案存在的上述技術(shù)問(wèn)題。
2、第一方面,本申請(qǐng)實(shí)施例提供一種知識(shí)圖譜構(gòu)建方法,包括:
3、對(duì)待處理新聞數(shù)據(jù)進(jìn)行文本預(yù)處理得到詞語(yǔ)序列;
4、基于所述詞語(yǔ)序列對(duì)所述待處理新聞進(jìn)行分類(lèi)和提取,得到目標(biāo)知識(shí)元;
5、基于所述目標(biāo)知識(shí)元以及預(yù)設(shè)構(gòu)建方式,構(gòu)建目標(biāo)知識(shí)三元組;
6、基于所述目標(biāo)知識(shí)三元組生成目標(biāo)知識(shí)圖譜。
7、在一個(gè)實(shí)施例中,所述對(duì)待處理新聞數(shù)據(jù)進(jìn)行文本預(yù)處理得到詞語(yǔ)序列包括:
8、獲取待處理新聞數(shù)據(jù),所述待處理新聞數(shù)據(jù)包括新聞內(nèi)容純文本和新聞元數(shù)據(jù);
9、對(duì)所述新聞內(nèi)容純文本和所述新聞元數(shù)據(jù)依次進(jìn)行清洗處理和分詞處理,得到詞語(yǔ)序列。
10、在一個(gè)實(shí)施例中,基于所述詞語(yǔ)序列對(duì)所述待處理新聞進(jìn)行分類(lèi),得到目標(biāo)知識(shí)元包括:
11、基于所述詞語(yǔ)序列對(duì)所述待處理新聞進(jìn)行新聞?lì)愋头诸?lèi),得到案件回顧類(lèi)新聞;
12、基于所述詞語(yǔ)序列對(duì)所述待處理新聞進(jìn)行主題分類(lèi),得到新聞主題,所述案件回顧類(lèi)新聞和所述新聞主題屬于目標(biāo)知識(shí)元。
13、在一個(gè)實(shí)施例中,基于所述詞語(yǔ)序列對(duì)所述待處理新聞進(jìn)行提取,得到目標(biāo)知識(shí)元包括:
14、基于所述詞語(yǔ)序列對(duì)所述待處理新聞進(jìn)行關(guān)鍵詞提取,得到目標(biāo)關(guān)鍵詞;
15、基于所述詞語(yǔ)序列對(duì)所述待處理新聞進(jìn)行實(shí)體提取,得到目標(biāo)實(shí)體,所述目標(biāo)關(guān)鍵詞和所述目標(biāo)實(shí)體屬于目標(biāo)知識(shí)元。
16、在一個(gè)實(shí)施例中,所述基于所述目標(biāo)知識(shí)元以及預(yù)設(shè)構(gòu)建方式,構(gòu)建目標(biāo)知識(shí)三元組包括:
17、在預(yù)設(shè)構(gòu)建方式為新聞元數(shù)據(jù)轉(zhuǎn)換知識(shí)的情況下,根據(jù)所述新聞元數(shù)據(jù)和所述目標(biāo)實(shí)體,構(gòu)建目標(biāo)知識(shí)三元組;
18、在預(yù)設(shè)構(gòu)建方式為詞表屬性轉(zhuǎn)換知識(shí)的情況下,根據(jù)所述目標(biāo)關(guān)鍵詞和所述目標(biāo)實(shí)體,構(gòu)建目標(biāo)知識(shí)三元組。
19、在一個(gè)實(shí)施例中,所述基于所述目標(biāo)知識(shí)元以及預(yù)設(shè)構(gòu)建方式,構(gòu)建目標(biāo)知識(shí)三元組還包括:
20、在預(yù)設(shè)構(gòu)建方式為主題分類(lèi)結(jié)果轉(zhuǎn)換知識(shí)的情況下,根據(jù)所述新聞主題構(gòu)建目標(biāo)知識(shí)三元組;
21、在預(yù)設(shè)構(gòu)建方式為共現(xiàn)關(guān)系構(gòu)建知識(shí)的情況下,根據(jù)所述目標(biāo)關(guān)鍵詞和關(guān)鍵實(shí)體,構(gòu)建目標(biāo)知識(shí)三元組;
22、在預(yù)設(shè)構(gòu)建方式為相似新聞處理的情況下,對(duì)所述待處理新聞進(jìn)行重復(fù)檢測(cè),根據(jù)重復(fù)檢測(cè)結(jié)果構(gòu)建目標(biāo)知識(shí)三元組。
23、在一個(gè)實(shí)施例中,所述基于所述目標(biāo)知識(shí)三元組生成目標(biāo)知識(shí)圖譜之后,包括:
24、對(duì)目標(biāo)新聞進(jìn)行分析,得到與所述目標(biāo)新聞存在關(guān)系的目標(biāo)實(shí)體,所述目標(biāo)實(shí)體不包括所述新聞元數(shù)據(jù)相關(guān)的實(shí)體;
25、確定所述目標(biāo)知識(shí)圖譜中存在的目標(biāo)實(shí)體的第一數(shù)量;
26、基于所述目標(biāo)實(shí)體的總數(shù)與所述第一數(shù)量的比值,以及預(yù)設(shè)閾值,確定所述目標(biāo)新聞是否重復(fù)。
27、第二方面,本申請(qǐng)實(shí)施例提供一種知識(shí)圖譜構(gòu)建裝置,包括:
28、文本預(yù)處理模塊,用于對(duì)待處理新聞數(shù)據(jù)進(jìn)行文本預(yù)處理得到詞語(yǔ)序列;
29、分類(lèi)提取模塊,用于基于所述詞語(yǔ)序列對(duì)所述待處理新聞進(jìn)行分類(lèi)和提取,得到目標(biāo)知識(shí)元;
30、目標(biāo)知識(shí)三元組構(gòu)建模塊,用于基于所述目標(biāo)知識(shí)元以及預(yù)設(shè)構(gòu)建方式,構(gòu)建目標(biāo)知識(shí)三元組;
31、目標(biāo)知識(shí)圖譜生成模塊,用于基于所述目標(biāo)知識(shí)三元組生成目標(biāo)知識(shí)圖譜。
32、第三方面,本申請(qǐng)實(shí)施例提供一種設(shè)備,包括處理器和存儲(chǔ)有計(jì)算機(jī)程序的存儲(chǔ)器,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)第一方面所述的知識(shí)圖譜構(gòu)建方法。
33、第四方面,本申請(qǐng)實(shí)施例提供一種非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)第一方面所述的知識(shí)圖譜構(gòu)建方法。
34、本申請(qǐng)實(shí)施例提供的知識(shí)圖譜構(gòu)建方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì),通過(guò)從新聞文本中獲取最新的反欺詐知識(shí),提取出用于識(shí)別欺詐內(nèi)容的關(guān)鍵詞實(shí)體至知識(shí)圖譜中,確保在反欺詐內(nèi)容識(shí)別環(huán)節(jié)能夠及時(shí)針對(duì)新型欺詐要素進(jìn)行響應(yīng),解決涉詐關(guān)鍵詞庫(kù)缺乏時(shí)效性的問(wèn)題;通過(guò)構(gòu)建基于新聞的知識(shí)圖譜,提取和組織新聞中包含的反欺詐知識(shí),獲取新聞內(nèi)容中的關(guān)鍵詞實(shí)體,得到關(guān)于新聞的全面描述,解決反欺詐信息來(lái)源不夠全面的問(wèn)題;通過(guò)知識(shí)圖譜進(jìn)行知識(shí)推理和知識(shí)關(guān)聯(lián),根據(jù)知識(shí)圖譜中的實(shí)體關(guān)聯(lián)直接推理出用于反欺詐決策的知識(shí)建議,并可通過(guò)關(guān)聯(lián)其他領(lǐng)域的實(shí)體圖譜,為反欺詐決策的制定提供全面的知識(shí)支撐,解決反欺詐決策制定環(huán)節(jié)知識(shí)支撐來(lái)源少的問(wèn)題。
1.一種知識(shí)圖譜構(gòu)建方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的知識(shí)圖譜構(gòu)建方法,其特征在于,所述對(duì)待處理新聞數(shù)據(jù)進(jìn)行文本預(yù)處理得到詞語(yǔ)序列包括:
3.根據(jù)權(quán)利要求2所述的知識(shí)圖譜構(gòu)建方法,其特征在于,基于所述詞語(yǔ)序列對(duì)所述待處理新聞進(jìn)行分類(lèi),得到目標(biāo)知識(shí)元包括:
4.根據(jù)權(quán)利要求3所述的知識(shí)圖譜構(gòu)建方法,其特征在于,基于所述詞語(yǔ)序列對(duì)所述待處理新聞進(jìn)行提取,得到目標(biāo)知識(shí)元包括:
5.根據(jù)權(quán)利要求4所述的知識(shí)圖譜構(gòu)建方法,其特征在于,所述基于所述目標(biāo)知識(shí)元以及預(yù)設(shè)構(gòu)建方式,構(gòu)建目標(biāo)知識(shí)三元組包括:
6.根據(jù)權(quán)利要求4所述的知識(shí)圖譜構(gòu)建方法,其特征在于,所述基于所述目標(biāo)知識(shí)元以及預(yù)設(shè)構(gòu)建方式,構(gòu)建目標(biāo)知識(shí)三元組還包括:
7.根據(jù)權(quán)利要求2所述的知識(shí)圖譜構(gòu)建方法,其特征在于,所述基于所述目標(biāo)知識(shí)三元組生成目標(biāo)知識(shí)圖譜之后,包括:
8.一種知識(shí)圖譜構(gòu)建裝置,其特征在于,包括:
9.一種電子設(shè)備,包括處理器和存儲(chǔ)有計(jì)算機(jī)程序的存儲(chǔ)器,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)權(quán)利要求1至7任一項(xiàng)所述的知識(shí)圖譜構(gòu)建方法。
10.一種非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一項(xiàng)所述知識(shí)圖譜構(gòu)建方法。