日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

標(biāo)簽體系構(gòu)建方法、裝置、設(shè)備及計(jì)算機(jī)程序產(chǎn)品與流程

文檔序號(hào):39720122發(fā)布日期:2024-10-22 13:10閱讀:14來源:國知局
標(biāo)簽體系構(gòu)建方法、裝置、設(shè)備及計(jì)算機(jī)程序產(chǎn)品與流程

本申請(qǐng)涉及數(shù)據(jù)處理領(lǐng)域,具體涉及一種標(biāo)簽體系構(gòu)建方法、裝置、設(shè)備及計(jì)算機(jī)程序產(chǎn)品。


背景技術(shù):

1、隨著互聯(lián)網(wǎng)的發(fā)展,移動(dòng)網(wǎng)絡(luò)的安全問題日益凸顯,除了傳統(tǒng)的網(wǎng)絡(luò)威脅外,還有諸如網(wǎng)頁篡改、網(wǎng)站后門、垃圾郵件、網(wǎng)絡(luò)釣魚、sql注入攻擊、c&c、點(diǎn)擊欺詐、分布式拒絕服務(wù)等網(wǎng)絡(luò)安全問題。由于網(wǎng)絡(luò)攻擊的多樣性及現(xiàn)有網(wǎng)絡(luò)環(huán)境存在大量潛在且難以預(yù)期的新攻擊類型,給網(wǎng)絡(luò)安全帶來了嚴(yán)峻的挑戰(zhàn),給惡意或者涉詐的網(wǎng)址識(shí)別其意圖并精準(zhǔn)高效地打上標(biāo)簽是亟待解決的技術(shù)問題。

2、針對(duì)惡意或者涉詐的網(wǎng)址分類標(biāo)簽構(gòu)建的相關(guān)研究主要可以分為以下三個(gè)方面:(1)基于人工設(shè)計(jì)的特征提取規(guī)則的惡意網(wǎng)址的分類識(shí)別,基于特征提取的惡意網(wǎng)址主要是基于該網(wǎng)址內(nèi)容所包含的靜態(tài)特征,如詞匯特征和詞嵌入等。此外還有動(dòng)態(tài)特征,例如,whois(域名查詢協(xié)議)信息和url是否有效等;(2)針對(duì)特征提取方法的特征空間的選擇與評(píng)估研究,如:基于隨機(jī)森林的特征選擇方法;基于filter(濾波器)特征選擇算法,研究能夠選擇出高相關(guān),低冗余和內(nèi)部依賴的特征子集;使用基于支持向量機(jī)的方法作為特征子集區(qū)分度衡量準(zhǔn)則,具有良好泛化能力;深度信念網(wǎng)絡(luò)與多類svm(support?vectormachine,支持向量機(jī))相結(jié)合的入侵檢測方法,進(jìn)行特征降維,從而獲得數(shù)據(jù)的最優(yōu)低維表示等;(3)針對(duì)改進(jìn)特征提取方式及提高檢測準(zhǔn)確率的機(jī)器學(xué)習(xí)算法改進(jìn)與應(yīng)用的研究。

3、現(xiàn)有技術(shù)方案的缺點(diǎn)如下:(1)只有單一模態(tài)的數(shù)據(jù),對(duì)特征的提取能力不足;(2)現(xiàn)有方法沒有考慮新的網(wǎng)址類型不斷增多或失效的情形,更新頻繁的樣本標(biāo)簽需要重新進(jìn)行訓(xùn)練,將會(huì)耗費(fèi)大量的人力和物力,成本較高;(3)網(wǎng)址標(biāo)簽構(gòu)建所依賴的特征規(guī)則庫無法自動(dòng)生成,智能化程度較低;(4)僅具備單一維度多分類的能力,對(duì)類別標(biāo)簽的表征能力有限;(5)現(xiàn)有標(biāo)簽體系不具備容錯(cuò)或修正機(jī)制,魯棒性不足。


技術(shù)實(shí)現(xiàn)思路

1、本申請(qǐng)實(shí)施例提供一種標(biāo)簽體系構(gòu)建方法、裝置、設(shè)備及計(jì)算機(jī)程序產(chǎn)品,用以解決的技術(shù)問題。

2、第一方面,本申請(qǐng)實(shí)施例提供一種標(biāo)簽體系構(gòu)建方法,包括:

3、對(duì)網(wǎng)址樣本進(jìn)行多模態(tài)抽取得到文本數(shù)據(jù)和圖像數(shù)據(jù);

4、對(duì)所述文本數(shù)據(jù)和所述圖像數(shù)據(jù)進(jìn)行表征提取得到層次分類標(biāo)簽;

5、對(duì)所述文本數(shù)據(jù)和所述圖像數(shù)據(jù)進(jìn)行語義提取得到語義標(biāo)簽;

6、基于所述層次分類標(biāo)簽、所述語義標(biāo)簽和預(yù)設(shè)靜態(tài)標(biāo)簽庫確定網(wǎng)址標(biāo)簽體系構(gòu)建結(jié)果。

7、在一個(gè)實(shí)施例中,所述標(biāo)簽體系構(gòu)建方法應(yīng)用于標(biāo)簽體系構(gòu)建系統(tǒng),所述標(biāo)簽體系構(gòu)建系統(tǒng)包括多模態(tài)數(shù)據(jù)抽取模塊;所述對(duì)網(wǎng)址樣本進(jìn)行多模態(tài)抽取得到文本數(shù)據(jù)和圖像數(shù)據(jù)包括:

8、將網(wǎng)址樣本輸入所述多模態(tài)數(shù)據(jù)抽取模塊進(jìn)行多模態(tài)抽取,得到文本數(shù)據(jù)和圖像數(shù)據(jù),文本數(shù)據(jù)包括標(biāo)題文本、內(nèi)容文本以及識(shí)別文本。

9、在一個(gè)實(shí)施例中,所述標(biāo)簽體系構(gòu)建系統(tǒng)還包括跨模態(tài)層次分類標(biāo)簽?zāi)P停隹缒B(tài)層次分類標(biāo)簽?zāi)P桶▓D像編碼器、文本編碼器、融合層和修正策略;所述對(duì)所述文本數(shù)據(jù)和所述圖像數(shù)據(jù)進(jìn)行表征提取得到層次分類標(biāo)簽包括:

10、將所述圖像數(shù)據(jù)輸入所述圖像編碼器得到圖像表征;

11、將所述文本數(shù)據(jù)輸入所述文本編碼器得到文本表征;

12、將所述圖像表征和所述文本特征依次通過所述融合層、全連接層以及歸一化層,得到初始標(biāo)簽;

13、基于所述修正策略對(duì)所述初始標(biāo)簽進(jìn)行修正,得到層次分類標(biāo)簽。

14、在一個(gè)實(shí)施例中,所述修正策略包括模型融合重排策略、自底向上修正策略和自頂向下修正策略。

15、在一個(gè)實(shí)施例中,所述初始標(biāo)簽包括一級(jí)標(biāo)簽和二級(jí)標(biāo)簽;所述基于所述修正策略對(duì)所述初始標(biāo)簽進(jìn)行修正,得到層次分類標(biāo)簽包括:

16、基于所述模型融合重排策略對(duì)所述文本編碼器對(duì)應(yīng)的模型的預(yù)測結(jié)果進(jìn)行重排序;

17、基于所述自底向上修正策略和所述二級(jí)標(biāo)簽預(yù)測的分類歸屬,修正所述一級(jí)標(biāo)簽的誤差;

18、基于所述自頂向下修正策略和所述一級(jí)標(biāo)簽,修正所述二級(jí)標(biāo)簽的誤差。

19、在一個(gè)實(shí)施例中,所述標(biāo)簽體系構(gòu)建系統(tǒng)還包括跨模態(tài)語義標(biāo)簽?zāi)P?,所述跨模態(tài)語義標(biāo)簽?zāi)P桶P(guān)系分類架構(gòu)和推理模塊;所述對(duì)所述文本數(shù)據(jù)和所述圖像數(shù)據(jù)進(jìn)行語義提取得到語義標(biāo)簽包括:

20、將所述文本表征通過所述關(guān)系分類架構(gòu)得到的結(jié)果,以及所述圖像表征的圖像識(shí)別結(jié)果輸入所述推理模塊,得到語義標(biāo)簽。

21、在一個(gè)實(shí)施例中,所述標(biāo)簽體系構(gòu)建系統(tǒng)還包括結(jié)果校準(zhǔn)模塊,所述結(jié)果校準(zhǔn)模塊包括預(yù)訓(xùn)練模型;所述基于所述層次分類標(biāo)簽、所述語義標(biāo)簽和預(yù)設(shè)靜態(tài)標(biāo)簽庫確定網(wǎng)址標(biāo)簽體系構(gòu)建結(jié)果包括:

22、將所述層次分類標(biāo)簽和所述語義標(biāo)簽的合并結(jié)果輸入所述預(yù)訓(xùn)練模型,得到第一標(biāo)簽;

23、將預(yù)設(shè)靜態(tài)標(biāo)簽庫中的標(biāo)簽輸入所述預(yù)訓(xùn)練模型得到第二標(biāo)簽;

24、將所述第一標(biāo)簽和所述第二標(biāo)簽進(jìn)行相似度對(duì)比,得到網(wǎng)址標(biāo)簽體系構(gòu)建結(jié)果。

25、第二方面,本申請(qǐng)實(shí)施例提供一種標(biāo)簽體系構(gòu)建裝置,包括:

26、多模態(tài)抽取模塊,用于對(duì)網(wǎng)址樣本進(jìn)行多模態(tài)抽取得到文本數(shù)據(jù)和圖像數(shù)據(jù);

27、表征提取模塊,用于對(duì)所述文本數(shù)據(jù)和所述圖像數(shù)據(jù)進(jìn)行表征提取得到層次分類標(biāo)簽;

28、語義提取模塊,用于對(duì)所述文本數(shù)據(jù)和所述圖像數(shù)據(jù)進(jìn)行語義提取得到語義標(biāo)簽;

29、網(wǎng)址標(biāo)簽體系構(gòu)建模塊,用于基于所述層次分類標(biāo)簽、所述語義標(biāo)簽和預(yù)設(shè)靜態(tài)標(biāo)簽庫確定網(wǎng)址標(biāo)簽體系構(gòu)建結(jié)果。

30、第三方面,本申請(qǐng)實(shí)施例提供一種設(shè)備,包括處理器和存儲(chǔ)有計(jì)算機(jī)程序的存儲(chǔ)器,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)第一方面所述的標(biāo)簽體系構(gòu)建方法。

31、第四方面,本申請(qǐng)實(shí)施例提供一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)第一方面所述的標(biāo)簽體系構(gòu)建方法。

32、本申請(qǐng)實(shí)施例提供的標(biāo)簽體系構(gòu)建方法、裝置、設(shè)備及計(jì)算機(jī)程序產(chǎn)品,通過對(duì)網(wǎng)址樣本進(jìn)行多模態(tài)抽取,得到文本數(shù)據(jù)和圖像數(shù)據(jù),對(duì)多模態(tài)抽取得到的文本數(shù)據(jù)和圖像數(shù)據(jù)進(jìn)行表征提取得到層次分類標(biāo)簽,然后對(duì)文本數(shù)據(jù)和圖像數(shù)據(jù)進(jìn)行語義提取得到語義標(biāo)簽,最后基于層次分類標(biāo)簽、語義標(biāo)簽以及預(yù)設(shè)靜態(tài)標(biāo)簽庫確定網(wǎng)址體系的構(gòu)建結(jié)果。本申請(qǐng)?zhí)嵘四P偷亩嗑S表征能力、泛化能力和性能指標(biāo);標(biāo)簽層次的準(zhǔn)確性提高,模型魯棒性增強(qiáng);實(shí)現(xiàn)了完備的標(biāo)簽體系化建設(shè),同時(shí)可以降本增效;增強(qiáng)標(biāo)簽體系的可信度。



技術(shù)特征:

1.一種標(biāo)簽體系構(gòu)建方法,其特征在于,包括:

2.根據(jù)權(quán)利要求1所述的標(biāo)簽體系構(gòu)建方法,其特征在于,所述標(biāo)簽體系構(gòu)建方法應(yīng)用于標(biāo)簽體系構(gòu)建系統(tǒng),所述標(biāo)簽體系構(gòu)建系統(tǒng)包括多模態(tài)數(shù)據(jù)抽取模塊;所述對(duì)網(wǎng)址樣本進(jìn)行多模態(tài)抽取得到文本數(shù)據(jù)和圖像數(shù)據(jù)包括:

3.根據(jù)權(quán)利要求2所述的標(biāo)簽體系構(gòu)建方法,其特征在于,所述標(biāo)簽體系構(gòu)建系統(tǒng)還包括跨模態(tài)層次分類標(biāo)簽?zāi)P?,所述跨模態(tài)層次分類標(biāo)簽?zāi)P桶▓D像編碼器、文本編碼器和融合層;所述對(duì)所述文本數(shù)據(jù)和所述圖像數(shù)據(jù)進(jìn)行表征提取得到層次分類標(biāo)簽包括:

4.根據(jù)權(quán)利要求3所述的標(biāo)簽體系構(gòu)建方法,其特征在于,所述修正策略包括模型融合重排策略、自底向上修正策略和自頂向下修正策略。

5.根據(jù)權(quán)利要求4所述的標(biāo)簽體系構(gòu)建方法,其特征在于,所述初始標(biāo)簽包括一級(jí)標(biāo)簽和二級(jí)標(biāo)簽;所述基于所述修正策略對(duì)所述初始標(biāo)簽進(jìn)行修正,得到層次分類標(biāo)簽包括:

6.根據(jù)權(quán)利要求3所述的標(biāo)簽體系構(gòu)建方法,其特征在于,所述標(biāo)簽體系構(gòu)建系統(tǒng)還包括跨模態(tài)語義標(biāo)簽?zāi)P?,所述跨模態(tài)語義標(biāo)簽?zāi)P桶P(guān)系分類架構(gòu)和推理模塊;所述對(duì)所述文本數(shù)據(jù)和所述圖像數(shù)據(jù)進(jìn)行語義提取得到語義標(biāo)簽包括:

7.根據(jù)權(quán)利要求2所述的標(biāo)簽體系構(gòu)建方法,其特征在于,所述標(biāo)簽體系構(gòu)建系統(tǒng)還包括結(jié)果校準(zhǔn)模塊,所述結(jié)果校準(zhǔn)模塊包括預(yù)訓(xùn)練模型;所述基于所述層次分類標(biāo)簽、所述語義標(biāo)簽和預(yù)設(shè)靜態(tài)標(biāo)簽庫確定網(wǎng)址標(biāo)簽體系構(gòu)建結(jié)果包括:

8.一種標(biāo)簽體系構(gòu)建裝置,其特征在于,包括:

9.一種電子設(shè)備,包括處理器和存儲(chǔ)有計(jì)算機(jī)程序的存儲(chǔ)器,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)權(quán)利要求1至7任一項(xiàng)所述的標(biāo)簽體系構(gòu)建方法。

10.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至7任一項(xiàng)所述的標(biāo)簽體系構(gòu)建方法。


技術(shù)總結(jié)
本申請(qǐng)涉及數(shù)據(jù)處理領(lǐng)域,提供一種標(biāo)簽體系構(gòu)建方法、裝置、設(shè)備及計(jì)算機(jī)程序產(chǎn)品。所述標(biāo)簽體系構(gòu)建方法包括:對(duì)網(wǎng)址樣本進(jìn)行多模態(tài)抽取得到文本數(shù)據(jù)和圖像數(shù)據(jù);對(duì)所述文本數(shù)據(jù)和所述圖像數(shù)據(jù)進(jìn)行表征提取得到層次分類標(biāo)簽;對(duì)所述文本數(shù)據(jù)和所述圖像數(shù)據(jù)進(jìn)行語義提取得到語義標(biāo)簽;基于所述層次分類標(biāo)簽、所述語義標(biāo)簽和預(yù)設(shè)靜態(tài)標(biāo)簽庫確定網(wǎng)址標(biāo)簽體系構(gòu)建結(jié)果。本申請(qǐng)?zhí)嵘四P偷亩嗑S表征能力、泛化能力和性能指標(biāo);標(biāo)簽層次的準(zhǔn)確性提高,模型魯棒性增強(qiáng);實(shí)現(xiàn)了完備的標(biāo)簽體系化建設(shè),同時(shí)可以降本增效;增強(qiáng)標(biāo)簽體系的可信度。

技術(shù)研發(fā)人員:胡澤遠(yuǎn),蔣健,李海傳,羅瓊,袁子昂
受保護(hù)的技術(shù)使用者:中國移動(dòng)通信集團(tuán)浙江有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2024/10/21
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1