日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

一種基于BERT和生成對(duì)抗網(wǎng)絡(luò)的煽動(dòng)性言論識(shí)別方法

文檔序號(hào):39728415發(fā)布日期:2024-10-22 13:31閱讀:1來(lái)源:國(guó)知局
一種基于BERT和生成對(duì)抗網(wǎng)絡(luò)的煽動(dòng)性言論識(shí)別方法

本發(fā)明涉及數(shù)據(jù)處理,特別是指一種基于bert和生成對(duì)抗網(wǎng)絡(luò)的煽動(dòng)性言論識(shí)別方法及系統(tǒng)。


背景技術(shù):

1、隨著信息技術(shù)的飛速發(fā)展,互聯(lián)網(wǎng)已成為人們獲取信息和交流思想的重要平臺(tái)。然而,這也為一些不良分子提供了散播煽動(dòng)性言論的溫床。這些言論不僅破壞了社會(huì)的和諧穩(wěn)定,還可能對(duì)國(guó)家安全造成威脅。因此,如何有效地識(shí)別和過(guò)濾這些不良言論,成為了當(dāng)前亟待解決的問(wèn)題。

2、傳統(tǒng)的文本分類(lèi)和情感分析方法在識(shí)別煽動(dòng)性言論方面存在著一定的局限性。傳統(tǒng)的煽動(dòng)性言論識(shí)別方法往往僅依賴(lài)于文本的表面特征,如關(guān)鍵詞、詞頻等,而忽略了文本的深層語(yǔ)義信息和上下文關(guān)系。這導(dǎo)致模型在識(shí)別復(fù)雜和隱晦的煽動(dòng)言論時(shí)效果不佳。在實(shí)際應(yīng)用中,煽動(dòng)性言論的數(shù)據(jù)往往較少,而正常言論的數(shù)據(jù)則相對(duì)豐富。這種數(shù)據(jù)不平衡問(wèn)題會(huì)導(dǎo)致模型在訓(xùn)練過(guò)程中偏向于正常言論的識(shí)別,從而降低了對(duì)煽動(dòng)性言論的識(shí)別能力。同時(shí),一些不良分子可能會(huì)故意制造對(duì)抗性樣本,以干擾和欺騙識(shí)別模型。傳統(tǒng)的識(shí)別方法往往難以應(yīng)對(duì)這種干擾,導(dǎo)致識(shí)別準(zhǔn)確率下降。

3、綜上所述,傳統(tǒng)的文本分類(lèi)和情感分析方法在識(shí)別煽動(dòng)性言論時(shí),識(shí)別復(fù)雜和隱晦的煽動(dòng)言論時(shí)效果不佳,容易受到數(shù)據(jù)不平衡的影響,導(dǎo)致模型在訓(xùn)練過(guò)程中偏向于正常言論的識(shí)別,難以應(yīng)對(duì)對(duì)抗性樣本,降低了對(duì)煽動(dòng)性言論的識(shí)別能力。


技術(shù)實(shí)現(xiàn)思路

1、為了解決傳統(tǒng)的文本分類(lèi)和情感分析方法在識(shí)別煽動(dòng)性言論時(shí),識(shí)別復(fù)雜和隱晦的煽動(dòng)言論時(shí)效果不佳,容易受到數(shù)據(jù)不平衡的影響,導(dǎo)致模型在訓(xùn)練過(guò)程中偏向于正常言論的識(shí)別,難以應(yīng)對(duì)對(duì)抗性樣本,降低了對(duì)煽動(dòng)性言論的識(shí)別能力的技術(shù)問(wèn)題,本發(fā)明提供了一種基于bert和生成對(duì)抗網(wǎng)絡(luò)的煽動(dòng)性言論識(shí)別方法及系統(tǒng)。

2、本發(fā)明實(shí)施例提供的技術(shù)方案如下:

3、本發(fā)明實(shí)施例的第一方面提供了一種基于bert和生成對(duì)抗網(wǎng)絡(luò)的煽動(dòng)性言論識(shí)別方法,包括:

4、s1:獲取煽動(dòng)性言論樣本數(shù)據(jù);

5、s2:構(gòu)建基于bert和生成對(duì)抗網(wǎng)絡(luò)的煽動(dòng)性言論識(shí)別模型;

6、s3:通過(guò)bert模型,從所述煽動(dòng)性言論樣本數(shù)據(jù)中提取數(shù)據(jù)特征;

7、s4:根據(jù)所述數(shù)據(jù)特征,通過(guò)對(duì)抗性訓(xùn)練,訓(xùn)練生成對(duì)抗網(wǎng)絡(luò)中的生成器以及鑒別器;

8、s5:獲取待識(shí)別數(shù)據(jù);

9、s6:通過(guò)bert模型,從所述待識(shí)別數(shù)據(jù)中提取待識(shí)別數(shù)據(jù)特征;

10、s7:根據(jù)所述待識(shí)別數(shù)據(jù)特征,通過(guò)訓(xùn)練完成的鑒別器,識(shí)別所述待識(shí)別數(shù)據(jù)中的煽動(dòng)性言論。

11、本發(fā)明實(shí)施例的第二方面提供了一種基于bert和生成對(duì)抗網(wǎng)絡(luò)的煽動(dòng)性言論識(shí)別裝置,包括:

12、獲取模塊,用于獲取煽動(dòng)性言論樣本數(shù)據(jù);

13、構(gòu)建模塊,用于構(gòu)建基于bert和生成對(duì)抗網(wǎng)絡(luò)的煽動(dòng)性言論識(shí)別模型;

14、提取模塊,用于通過(guò)bert模型,從所述煽動(dòng)性言論樣本數(shù)據(jù)中提取數(shù)據(jù)特征;

15、訓(xùn)練模塊,用于根據(jù)所述數(shù)據(jù)特征,通過(guò)對(duì)抗性訓(xùn)練,訓(xùn)練生成對(duì)抗網(wǎng)絡(luò)中的生成器以及鑒別器;

16、獲取模塊,還用于獲取待識(shí)別數(shù)據(jù);

17、提取模塊,還用于通過(guò)bert模型,從所述待識(shí)別數(shù)據(jù)中提取待識(shí)別數(shù)據(jù)特征;

18、識(shí)別模塊,用于根據(jù)所述待識(shí)別數(shù)據(jù)特征,通過(guò)訓(xùn)練完成的鑒別器,識(shí)別所述待識(shí)別數(shù)據(jù)中的煽動(dòng)性言論。

19、本發(fā)明實(shí)施例的第三方面提供了一種基于bert和生成對(duì)抗網(wǎng)絡(luò)的煽動(dòng)性言論識(shí)別系統(tǒng),包括:

20、處理器,所述處理器包含一個(gè)或多個(gè)處理核心,通過(guò)讀取并執(zhí)行存儲(chǔ)在存儲(chǔ)器中的指令、程序、代碼集或指令集,以及調(diào)用相應(yīng)的數(shù)據(jù),驅(qū)動(dòng)終端設(shè)備處理大量的數(shù)據(jù)和執(zhí)行多樣化的任務(wù);

21、存儲(chǔ)器,所述存儲(chǔ)器上存儲(chǔ)有計(jì)算機(jī)可讀指令,所述計(jì)算機(jī)可讀指令被所述處理器執(zhí)行時(shí),實(shí)現(xiàn)如第一方面所述的基于bert和生成對(duì)抗網(wǎng)絡(luò)的煽動(dòng)性言論識(shí)別方法。

22、本發(fā)明實(shí)施例的第四方面提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如第一方面所述的基于bert和生成對(duì)抗網(wǎng)絡(luò)的煽動(dòng)性言論識(shí)別方法。

23、本發(fā)明實(shí)施例提供的技術(shù)方案帶來(lái)的有益效果至少包括:

24、在本發(fā)明中,構(gòu)建基于bert和生成對(duì)抗的煽動(dòng)性言論識(shí)別模型,通過(guò)生成對(duì)抗數(shù)據(jù)和優(yōu)化對(duì)抗性訓(xùn)練,解決數(shù)據(jù)不平衡問(wèn)題,提升對(duì)于對(duì)抗性樣本的識(shí)別能力,通過(guò)bert模型,從待識(shí)別數(shù)據(jù)中準(zhǔn)確提取待識(shí)別數(shù)據(jù)特征,進(jìn)而通過(guò)訓(xùn)練完成的鑒別器,準(zhǔn)確識(shí)別出煽動(dòng)性言論,提升煽動(dòng)性言論的識(shí)別準(zhǔn)確性和魯棒性。



技術(shù)特征:

1.一種基于bert和生成對(duì)抗網(wǎng)絡(luò)的煽動(dòng)性言論識(shí)別方法,其特征在于,包括:

2.根據(jù)權(quán)利要求1所述的基于bert和生成對(duì)抗網(wǎng)絡(luò)的煽動(dòng)性言論識(shí)別方法,其特征在于,所述s1具體為:

3.根據(jù)權(quán)利要求1所述的基于bert和生成對(duì)抗網(wǎng)絡(luò)的煽動(dòng)性言論識(shí)別方法,其特征在于,所述基于bert和生成對(duì)抗網(wǎng)絡(luò)的煽動(dòng)性言論模型包括:預(yù)訓(xùn)練bert模型和生成對(duì)抗網(wǎng)絡(luò);

4.根據(jù)權(quán)利要求1所述的基于bert和生成對(duì)抗網(wǎng)絡(luò)的煽動(dòng)性言論識(shí)別方法,其特征在于,所述s3具體包括:

5.根據(jù)權(quán)利要求1所述的基于bert和生成對(duì)抗網(wǎng)絡(luò)的煽動(dòng)性言論識(shí)別方法,其特征在于,通過(guò)最小化損失函數(shù)對(duì)bert模型進(jìn)行訓(xùn)練,所述損失函數(shù)包括掩碼語(yǔ)言模型mlm的損失和下一句預(yù)測(cè)nsp的損失;

6.根據(jù)權(quán)利要求1所述的基于bert和生成對(duì)抗網(wǎng)絡(luò)的煽動(dòng)性言論識(shí)別方法,其特征在于,所述s4具體包括:

7.一種基于bert和生成對(duì)抗網(wǎng)絡(luò)的煽動(dòng)性言論識(shí)別裝置,其特征在于,包括:

8.根據(jù)權(quán)利要求7所述的基于bert和生成對(duì)抗網(wǎng)絡(luò)的煽動(dòng)性言論識(shí)別裝置,其特征在于,所述獲取模塊具體用于:

9.根據(jù)權(quán)利要求7所述的基于bert和生成對(duì)抗網(wǎng)絡(luò)的煽動(dòng)性言論識(shí)別裝置,其特征在于,基于bert和生成對(duì)抗網(wǎng)絡(luò)的煽動(dòng)性言論模型包括:預(yù)訓(xùn)練bert模型和生成對(duì)抗網(wǎng)絡(luò);

10.根據(jù)權(quán)利要求7所述的基于bert和生成對(duì)抗網(wǎng)絡(luò)的煽動(dòng)性言論識(shí)別裝置,其特征在于,所述提取模塊具體用于:


技術(shù)總結(jié)
本發(fā)明提供一種基于BERT和生成對(duì)抗網(wǎng)絡(luò)的煽動(dòng)性言論識(shí)別方法及系統(tǒng),涉及數(shù)據(jù)傳輸技術(shù)領(lǐng)域,方法包括:獲取煽動(dòng)性言論樣本數(shù)據(jù);構(gòu)建基于BERT和生成對(duì)抗網(wǎng)絡(luò)的煽動(dòng)性言論識(shí)別模型;通過(guò)BERT模型,從煽動(dòng)性言論樣本數(shù)據(jù)中提取數(shù)據(jù)特征;根據(jù)數(shù)據(jù)特征,通過(guò)對(duì)抗性訓(xùn)練,訓(xùn)練生成對(duì)抗網(wǎng)絡(luò)中的生成器以及鑒別器;獲取待識(shí)別數(shù)據(jù);通過(guò)BERT模型,從待識(shí)別數(shù)據(jù)中提取待識(shí)別數(shù)據(jù)特征;根據(jù)待識(shí)別數(shù)據(jù)特征,通過(guò)訓(xùn)練完成的鑒別器,識(shí)別待識(shí)別數(shù)據(jù)中的煽動(dòng)性言論。本發(fā)明可以準(zhǔn)確識(shí)別出煽動(dòng)性言論,提升煽動(dòng)性言論的識(shí)別準(zhǔn)確性。

技術(shù)研發(fā)人員:徐晶,汪浩杰,艾冬梅,賀可太,李曄
受保護(hù)的技術(shù)使用者:北京科技大學(xué)
技術(shù)研發(fā)日:
技術(shù)公布日:2024/10/21
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1