本發(fā)明涉及網(wǎng)絡(luò)安全,尤其涉及一種智能分析數(shù)據(jù)安全識(shí)別方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、隨著時(shí)代發(fā)展,大數(shù)據(jù)技術(shù)和人工智能技術(shù)發(fā)展迅速,相關(guān)自動(dòng)化與智能化的識(shí)別和處理能力、數(shù)據(jù)分析能力逐漸與網(wǎng)絡(luò)安全技術(shù)進(jìn)行了深度協(xié)同,對(duì)網(wǎng)絡(luò)安全的技術(shù)、方法、應(yīng)用產(chǎn)生了重要影響。可以預(yù)見的是安全數(shù)據(jù)采集和安全智能數(shù)據(jù)分析技術(shù)的成熟將會(huì)大幅提升網(wǎng)絡(luò)安全威脅檢測(cè)、網(wǎng)絡(luò)安全風(fēng)險(xiǎn)評(píng)估等關(guān)鍵安全防御環(huán)節(jié)的效率,大幅度減少網(wǎng)絡(luò)的安全性。
2、目前的安全防護(hù)手段主要還是基于傳統(tǒng)安全思想,現(xiàn)有的安全防護(hù)技術(shù)為利用傳統(tǒng)安全設(shè)備進(jìn)行阻攔,如:防火墻,入侵防御系統(tǒng),網(wǎng)站應(yīng)用級(jí)入侵防御系統(tǒng)。傳統(tǒng)安全設(shè)備使用阻攔規(guī)則來根據(jù)數(shù)據(jù)指紋和訪問量級(jí)判別是否存在網(wǎng)絡(luò)攻擊或異常行為,這些阻攔規(guī)則可以根據(jù)實(shí)際需求進(jìn)行配置,以提供一定程度上的安全防護(hù)。然而,對(duì)于新型漏洞或凌日漏洞,傳統(tǒng)的阻攔規(guī)則缺乏行之有效的安全防護(hù)策略,導(dǎo)致智能分析數(shù)據(jù)識(shí)別能力較低。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提供一種智能分析數(shù)據(jù)安全識(shí)別方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),用以解決現(xiàn)有技術(shù)中智能分析數(shù)據(jù)安全識(shí)別能力低下的問題。
2、第一方面,本發(fā)明提供一種智能分析數(shù)據(jù)安全識(shí)別方法,包括:
3、獲取數(shù)據(jù)源;所述數(shù)據(jù)源包括用戶信息和用戶流量數(shù)據(jù);
4、基于所述數(shù)據(jù)源進(jìn)行特征提取,得到第一特征向量;
5、將所述第一特征向量輸入至數(shù)據(jù)分析模型,得到流量類型識(shí)別結(jié)果;所述數(shù)據(jù)分析模型是基于目標(biāo)懲罰因子、目標(biāo)核函數(shù)參數(shù)和目標(biāo)加權(quán)系數(shù)進(jìn)行訓(xùn)練所得到的;所述目標(biāo)懲罰因子、所述目標(biāo)核函數(shù)參數(shù)和所述目標(biāo)加權(quán)系數(shù)是基于遺傳算法結(jié)合樣本特征向量、高斯核函數(shù)與預(yù)設(shè)懲罰因子進(jìn)行參數(shù)優(yōu)化所得到的;
6、將所述第一特征向量和所述流量類型識(shí)別結(jié)果輸入至流量異常檢測(cè)模型,得到特征異常率;所述流量異常檢測(cè)模型是基于流量類型樣本向量進(jìn)行訓(xùn)練所得到的;
7、基于所述特征異常率進(jìn)行異常識(shí)別,得到智能分析數(shù)據(jù)安全識(shí)別結(jié)果。
8、在一個(gè)實(shí)施例中,所述數(shù)據(jù)分析模型是基于如下步驟確定的:
9、確定樣本特征向量;
10、確定所述樣本特征向量中各特征的信息熵貢獻(xiàn)率;所述信息熵貢獻(xiàn)率用于反映特征對(duì)于預(yù)測(cè)任務(wù)的重要程度;
11、基于各信息熵貢獻(xiàn)率,對(duì)高斯核函數(shù)進(jìn)行加權(quán),得到加權(quán)核函數(shù);
12、基于所述加權(quán)核函數(shù)與非線性核函數(shù)進(jìn)行線性組合,得到組合核函數(shù);
13、確定所述組合核函數(shù)中的初始核函數(shù)參數(shù)和初始加權(quán)系數(shù);核函數(shù)參數(shù)用于優(yōu)化支持向量機(jī)的泛化能力;加權(quán)系數(shù)用于調(diào)節(jié)所述加權(quán)核函數(shù)與所述非線性核函數(shù)在所述組合核函數(shù)中的權(quán)重;
14、基于遺傳算法,對(duì)所述預(yù)設(shè)懲罰因子、所述初始核函數(shù)參數(shù)和所述初始加權(quán)系數(shù)進(jìn)行參數(shù)優(yōu)化,得到目標(biāo)懲罰因子、目標(biāo)核函數(shù)參數(shù)和目標(biāo)加權(quán)系數(shù);
15、基于所述目標(biāo)懲罰因子、所述目標(biāo)核函數(shù)參數(shù)和所述目標(biāo)加權(quán)系數(shù),對(duì)支持向量機(jī)進(jìn)行訓(xùn)練,得到數(shù)據(jù)分析模型。
16、在一個(gè)實(shí)施例中,所述基于遺傳算法,對(duì)所述預(yù)設(shè)懲罰因子、所述初始核函數(shù)參數(shù)和所述初始加權(quán)系數(shù)進(jìn)行參數(shù)優(yōu)化,得到目標(biāo)懲罰因子、目標(biāo)核函數(shù)參數(shù)和目標(biāo)加權(quán)系數(shù),包括:
17、基于所述預(yù)設(shè)懲罰因子、所述初始核函數(shù)參數(shù)和所述初始加權(quán)系數(shù)進(jìn)行二進(jìn)制編碼,得到多條第一待選染色體編碼;
18、從所有第一待選染色體編碼中選擇第一預(yù)設(shè)數(shù)量的第一染色體編碼;
19、基于各第一染色體編碼進(jìn)行交叉處理,得到第一預(yù)設(shè)數(shù)量的第一交叉編碼;
20、對(duì)各第一交叉編碼進(jìn)行變異處理,得到第一預(yù)設(shè)數(shù)量的第一變異編碼;
21、根據(jù)各第一變異編碼和各剩余染色體編碼更新所述第一待選染色體編碼;所述剩余染色體編碼指的是所有第一待選染色體編碼中,除了第一染色體編碼之外剩下的第一待選染色體編碼;
22、迭代執(zhí)行所述從所有第一待選染色體編碼中選擇第一預(yù)設(shè)數(shù)量的第一染色體編碼的步驟,直至迭代次數(shù)達(dá)到預(yù)設(shè)次數(shù)或更新后的第一待選染色體編碼滿足預(yù)設(shè)規(guī)則,得到染色體編碼最優(yōu)解;
23、基于所述染色體編碼最優(yōu)解,確定目標(biāo)懲罰因子、目標(biāo)核函數(shù)參數(shù)和目標(biāo)加權(quán)系數(shù)。
24、在一個(gè)實(shí)施例中,所述流量異常檢測(cè)模型包括流量特征檢測(cè)模型、字符特征檢測(cè)模型和時(shí)間序列統(tǒng)計(jì)特征檢測(cè)模型;所述流量特征檢測(cè)模型是基于流量特征樣本向量進(jìn)行訓(xùn)練所得到的;所述字符特征檢測(cè)模型是基于字符特征樣本向量進(jìn)行訓(xùn)練所得到的;所述時(shí)間序列統(tǒng)計(jì)特征檢測(cè)模型是基于時(shí)間序列統(tǒng)計(jì)特征樣本向量進(jìn)行訓(xùn)練所得到的;所述特征異常率包括流量特征異常率、字符特征異常率和時(shí)間序列統(tǒng)計(jì)特征異常率。
25、在一個(gè)實(shí)施例中,所述基于所述特征異常率,確定智能分析數(shù)據(jù)安全識(shí)別結(jié)果,包括:
26、確定第一預(yù)設(shè)權(quán)重系數(shù)、第二預(yù)設(shè)權(quán)重系數(shù)和第三預(yù)設(shè)權(quán)重系數(shù);
27、基于所述第一預(yù)設(shè)權(quán)重系數(shù),對(duì)流量特征異常率進(jìn)行加權(quán)計(jì)算,得到流量特征加權(quán)值;
28、基于所述第二預(yù)設(shè)權(quán)重系數(shù),對(duì)字符特征異常率進(jìn)行加權(quán)計(jì)算,得到字符特征加權(quán)值;
29、基于所述第三預(yù)設(shè)權(quán)重系數(shù),對(duì)時(shí)間序列統(tǒng)計(jì)特征異常率進(jìn)行加權(quán)計(jì)算,得到時(shí)間序列統(tǒng)計(jì)特征加權(quán)值;
30、對(duì)所述流量特征加權(quán)值、所述字符特征加權(quán)值和所述時(shí)間序列統(tǒng)計(jì)特征加權(quán)值進(jìn)行均值計(jì)算,得到特征異常平均值;
31、基于所述特征異常平均值進(jìn)行異常識(shí)別,得到智能分析數(shù)據(jù)安全識(shí)別結(jié)果。
32、在一個(gè)實(shí)施例中,所述基于所述特征異常平均值進(jìn)行異常識(shí)別,得到智能分析數(shù)據(jù)安全識(shí)別結(jié)果,包括:
33、若所述特征異常平均值大于預(yù)設(shè)閾值,則確定智能分析數(shù)據(jù)安全識(shí)別結(jié)果為存在網(wǎng)絡(luò)異常;
34、若所述特征異常平均值小于或等于預(yù)設(shè)閾值,則確定智能分析數(shù)據(jù)安全識(shí)別結(jié)果為網(wǎng)絡(luò)正常。
35、在一個(gè)實(shí)施例中,所述基于所述數(shù)據(jù)源進(jìn)行特征提取,得到第一特征向量,包括:
36、對(duì)所述數(shù)據(jù)源進(jìn)行字段化處理,得到字段數(shù)據(jù);
37、對(duì)所述字段數(shù)據(jù)進(jìn)行特征提取,得到第二特征向量;
38、基于特征哈希函數(shù),對(duì)所述第二特征向量進(jìn)行特征提取,得到第一特征向量;所述特征哈希函數(shù)用于將高維特征向量映射到低維特征向量。
39、第二方面,本發(fā)明還提供一種智能分析數(shù)據(jù)安全識(shí)別裝置,包括:
40、獲取模塊,用于獲取數(shù)據(jù)源;所述數(shù)據(jù)源包括用戶信息和用戶流量數(shù)據(jù);
41、特征提取模塊,用于基于所述數(shù)據(jù)源進(jìn)行特征提取,得到第一特征向量;
42、流量類型識(shí)別模塊,用于將所述第一特征向量輸入至數(shù)據(jù)分析模型,得到流量類型識(shí)別結(jié)果;所述數(shù)據(jù)分析模型是基于目標(biāo)懲罰因子、目標(biāo)核函數(shù)參數(shù)和目標(biāo)加權(quán)系數(shù)進(jìn)行訓(xùn)練所得到的;所述目標(biāo)懲罰因子、所述目標(biāo)核函數(shù)參數(shù)和所述目標(biāo)加權(quán)系數(shù)是基于遺傳算法結(jié)合樣本特征向量、高斯核函數(shù)與預(yù)設(shè)懲罰因子進(jìn)行參數(shù)優(yōu)化所得到的;
43、流量異常檢測(cè)模塊,用于將所述第一特征向量和所述流量類型識(shí)別結(jié)果輸入至流量異常檢測(cè)模型,得到特征異常率;
44、安全識(shí)別模塊,用于基于所述特征異常率進(jìn)行異常識(shí)別,得到智能分析數(shù)據(jù)安全識(shí)別結(jié)果。
45、第三方面,本發(fā)明提供一種電子設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)如上述任一種所述智能分析數(shù)據(jù)安全識(shí)別方法的步驟。
46、第四方面,本發(fā)明還提供一種非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述任一種所述智能分析數(shù)據(jù)安全識(shí)別方法的步驟。
47、本發(fā)明提供的智能分析數(shù)據(jù)安全識(shí)別方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),采用遺傳算法結(jié)合樣本特征向量、高斯核函數(shù)與預(yù)設(shè)懲罰因子進(jìn)行參數(shù)優(yōu)化,得到優(yōu)化后的數(shù)據(jù)分析模型,提高了數(shù)據(jù)分析模型的分類準(zhǔn)確性和泛化能力,因此,通過將第一特征向量輸入至數(shù)據(jù)分析模型,可以實(shí)現(xiàn)對(duì)用戶用網(wǎng)行為所產(chǎn)生的數(shù)據(jù)進(jìn)行嚴(yán)格數(shù)據(jù)分析,得到流量類型識(shí)別結(jié)果,進(jìn)一步將第一特征向量和流量類型識(shí)別結(jié)果輸入至流量異常檢測(cè)模型,得到特征異常率,以確定出智能分析數(shù)據(jù)安全識(shí)別結(jié)果,對(duì)用戶用網(wǎng)行為的安全性進(jìn)行實(shí)時(shí)評(píng)估,可以實(shí)現(xiàn)有效的非法行為檢測(cè),確保用戶用網(wǎng)時(shí)的數(shù)據(jù)安全性和業(yè)務(wù)完整性,從而提高智能分析數(shù)據(jù)安全識(shí)別能力。