本公開的實(shí)施例涉及計(jì)算機(jī),具體涉及日志異常檢測(cè)方法、裝置、設(shè)備和計(jì)算機(jī)可讀介質(zhì)。
背景技術(shù):
1、系統(tǒng)日志是記錄系統(tǒng)運(yùn)行狀態(tài)的重要工具,當(dāng)系統(tǒng)日志出現(xiàn)異常,則表示系統(tǒng)運(yùn)行出現(xiàn)了異常。目前,對(duì)日志進(jìn)行異常檢測(cè)時(shí),通常采用的方式為:使用深度學(xué)習(xí)網(wǎng)絡(luò)模型(例如,deeplog(深度日志)模型)直接對(duì)系統(tǒng)日志信息進(jìn)行異常檢測(cè)。
2、然而,發(fā)明人發(fā)現(xiàn),當(dāng)采用上述方式檢測(cè)異常日志時(shí),經(jīng)常會(huì)存在如下技術(shù)問(wèn)題:
3、常見的深度學(xué)習(xí)網(wǎng)絡(luò)模型沒有考慮提取日志的語(yǔ)義信息作為參考,導(dǎo)致深度學(xué)習(xí)網(wǎng)絡(luò)模型的準(zhǔn)確度降低,從而導(dǎo)致日志異常檢測(cè)的準(zhǔn)確度降低。
4、該背景技術(shù)部分中所公開的以上信息僅用于增強(qiáng)對(duì)本發(fā)明構(gòu)思的背景的理解,并因此,其可包含并不形成本國(guó)的本領(lǐng)域普通技術(shù)人員已知的現(xiàn)有技術(shù)的信息。
技術(shù)實(shí)現(xiàn)思路
1、本公開的內(nèi)容部分用于以簡(jiǎn)要的形式介紹構(gòu)思,這些構(gòu)思將在后面的具體實(shí)施方式部分被詳細(xì)描述。本公開的內(nèi)容部分并不旨在標(biāo)識(shí)要求保護(hù)的技術(shù)方案的關(guān)鍵特征或必要特征,也不旨在用于限制所要求的保護(hù)的技術(shù)方案的范圍。
2、本公開的一些實(shí)施例提出了日志異常檢測(cè)方法、裝置、電子設(shè)備、計(jì)算機(jī)可讀介質(zhì)和程序產(chǎn)品,來(lái)解決以上背景技術(shù)部分提到的技術(shù)問(wèn)題中的一項(xiàng)或多項(xiàng)。
3、第一方面,本公開的一些實(shí)施例提供了一種日志異常檢測(cè)方法,該方法包括:獲取歷史日志信息序列;對(duì)上述歷史日志信息序列中的各個(gè)歷史日志信息進(jìn)行模板提取處理,得到日志模板信息序列;對(duì)上述日志模板信息序列中的每個(gè)日志模板信息進(jìn)行特征提取處理以生成目標(biāo)日志模板向量,得到目標(biāo)日志模板向量序列;對(duì)上述目標(biāo)日志模板向量序列進(jìn)行異常檢測(cè)處理,得到異常檢測(cè)結(jié)果。
4、可選地,上述日志異常檢測(cè)方法還包括:響應(yīng)于確定上述異常檢測(cè)結(jié)果滿足預(yù)設(shè)條件,將上述歷史日志信息序列中最后一個(gè)歷史日志信息發(fā)送至顯示終端。
5、可選地,上述日志模板信息序列中的日志模板信息包括:日志文本單詞集;以及上述對(duì)上述日志模板信息序列中的每個(gè)日志模板信息進(jìn)行特征提取處理以生成目標(biāo)日志模板向量,包括:基于上述日志模板信息包括的日志文本單詞集,生成歷史日志模板向量集;對(duì)上述日志文本單詞集中的各個(gè)日志文本單詞進(jìn)行詞性提取處理,得到日志文本單詞詞性信息集;基于預(yù)設(shè)的詞性權(quán)重對(duì)照表和上述日志文本單詞詞性信息集,對(duì)上述歷史日志模板向量集中的各個(gè)歷史日志模板向量進(jìn)行加權(quán)求和處理,得到上述目標(biāo)日志模板向量。
6、可選地,上述對(duì)上述目標(biāo)日志模板向量序列進(jìn)行異常檢測(cè)處理,得到異常檢測(cè)結(jié)果,包括:將上述目標(biāo)日志模板向量序列中最后一個(gè)目標(biāo)日志模板向量確定為第一目標(biāo)模板向量;將上述第一目標(biāo)模板向量從上述目標(biāo)日志模板向量序列中刪除,得到目標(biāo)歷史模板向量序列;將上述目標(biāo)歷史模板向量序列輸入至預(yù)先訓(xùn)練的日志序列異常檢測(cè)模型,得到第二目標(biāo)模板向量;將上述第一目標(biāo)模板向量和上述第二目標(biāo)模板向量的距離值確定為目標(biāo)模板向量距離值;基于上述目標(biāo)模板向量距離值,生成異常檢測(cè)結(jié)果。
7、可選地,上述預(yù)先訓(xùn)練的日志序列異常檢測(cè)模型和上述預(yù)設(shè)的詞性權(quán)重對(duì)照表是通過(guò)以下步驟訓(xùn)練得到的:獲取樣本日志信息組、初始詞性權(quán)重對(duì)照表組和初始日志序列異常檢測(cè)模型組,其中,上述初始詞性權(quán)重對(duì)照表組中的初始詞性權(quán)重對(duì)照表與上述初始日志序列異常檢測(cè)模型組中的初始日志序列異常檢測(cè)模型一一對(duì)應(yīng);基于上述樣本日志信息組和預(yù)設(shè)的損失函數(shù),對(duì)上述初始詞性權(quán)重對(duì)照表組和初始日志序列異常檢測(cè)模型組進(jìn)行訓(xùn)練處理,得到訓(xùn)練后的日志序列異常檢測(cè)模型和訓(xùn)練后的詞性權(quán)重對(duì)照表。
8、可選地,上述初始日志序列異常檢測(cè)模型組中的初始日志序列異常檢測(cè)模型包括:初始語(yǔ)義提取模型和初始日志預(yù)測(cè)模型,上述樣本日志信息組中的樣本日志信息包括:樣本歷史日志向量序列和樣本目標(biāo)向量;以及上述基于上述樣本日志信息組和預(yù)設(shè)的損失函數(shù),對(duì)上述初始詞性權(quán)重對(duì)照表組和初始日志序列異常檢測(cè)模型組進(jìn)行訓(xùn)練處理,得到訓(xùn)練后的日志序列異常檢測(cè)模型和訓(xùn)練后的詞性權(quán)重對(duì)照表,包括:對(duì)于上述初始日志序列異常檢測(cè)模型組中的每個(gè)初始日志序列異常檢測(cè)模型,執(zhí)行以下訓(xùn)練步驟:從樣本日志信息組中選取樣本日志信息;基于初始詞性權(quán)重對(duì)照表組中與初始日志序列異常檢測(cè)模型對(duì)應(yīng)的初始詞性權(quán)重對(duì)照表,對(duì)樣本日志信息包括的樣本歷史日志向量序列和樣本目標(biāo)向量進(jìn)行特征提取處理,得到樣本日志模板向量序列和樣本目標(biāo)模板日志向量;將樣本日志模板向量序列輸入至初始日志序列異常檢測(cè)模型包括的初始語(yǔ)義提取模型,得到樣本日志模板語(yǔ)義信息序列;將樣本日志模板語(yǔ)義信息序列輸入至初始日志序列異常檢測(cè)模型包括的初始日志預(yù)測(cè)模型,得到預(yù)測(cè)日志模板向量序列;基于預(yù)測(cè)日志模板向量序列,生成樣本目標(biāo)預(yù)測(cè)日志模板向量;基于預(yù)設(shè)的損失函數(shù)、樣本目標(biāo)預(yù)測(cè)日志模板向量和樣本目標(biāo)模板日志向量,確定異常檢測(cè)損失值;將所確定的各個(gè)異常檢測(cè)損失值組合為異常檢測(cè)損失值集;基于上述初始詞性權(quán)重對(duì)照表組、上述初始日志序列異常檢測(cè)模型組和上述異常檢測(cè)損失值集,確定日志序列異常檢測(cè)模型和詞性權(quán)重對(duì)照表組。
9、可選地,上述基于上述初始詞性權(quán)重對(duì)照表組、上述初始日志序列異常檢測(cè)模型組和上述異常檢測(cè)損失值集,確定日志序列異常檢測(cè)模型和詞性權(quán)重對(duì)照表組,包括:響應(yīng)于確定上述異常檢測(cè)損失值集中至少一個(gè)異常檢測(cè)損失值小于目標(biāo)值,將上述異常檢測(cè)損失值集中最小的異常檢測(cè)損失值確定為第一目標(biāo)異常檢測(cè)損失值;將上述初始日志序列異常檢測(cè)模型組中與上述第一目標(biāo)異常檢測(cè)損失值對(duì)應(yīng)的初始日志序列異常檢測(cè)模型確定為日志序列異常檢測(cè)模型;將上述初始詞性權(quán)重對(duì)照表組中與上述日志序列異常檢測(cè)模型對(duì)應(yīng)的初始詞性權(quán)重對(duì)照表確定為詞性權(quán)重對(duì)照表組。
10、可選地,上述日志異常檢測(cè)方法還包括:響應(yīng)于確定上述異常檢測(cè)損失值集中的異常檢測(cè)損失值均大于等于目標(biāo)值,調(diào)整上述初始日志序列異常檢測(cè)模型組中各個(gè)初始日志序列異常檢測(cè)模型的相關(guān)參數(shù)和上述初始詞性權(quán)重對(duì)照表組中各個(gè)初始詞性權(quán)重對(duì)照表的相關(guān)參數(shù),得到調(diào)整后日志序列異常檢測(cè)模型組和調(diào)整后詞性權(quán)重對(duì)照表組;從上述樣本日志模板信息組中重新選取樣本日志模板信息,將上述調(diào)整初始日志序列異常檢測(cè)模型組確定為初始日志序列異常檢測(cè)模型組以及將上述調(diào)整初始詞性權(quán)重對(duì)照表組確定為初始詞性權(quán)重對(duì)照表組,以供再次執(zhí)行上述訓(xùn)練處理步驟。
11、可選地,上述調(diào)整上述初始日志序列異常檢測(cè)模型組中各個(gè)初始日志序列異常檢測(cè)模型的相關(guān)參數(shù)和上述初始詞性權(quán)重對(duì)照表組中各個(gè)初始詞性權(quán)重對(duì)照表的相關(guān)參數(shù),得到調(diào)整后日志序列異常檢測(cè)模型組,包括:將上述異常檢測(cè)損失值集中最小的異常檢測(cè)損失值確定為第二目標(biāo)異常檢測(cè)損失值;基于上述第二目標(biāo)異常檢測(cè)損失值,確定目標(biāo)初始日志序列異常檢測(cè)模型和目標(biāo)初始詞性權(quán)重對(duì)照表;基于上述目標(biāo)初始日志序列異常檢測(cè)模型和上述目標(biāo)初始詞性權(quán)重對(duì)照表,生成目標(biāo)初始日志序列異常檢測(cè)模型組和目標(biāo)初始詞性權(quán)重對(duì)照表組;對(duì)上述目標(biāo)初始日志序列異常檢測(cè)模型組中的各個(gè)目標(biāo)初始日志序列異常檢測(cè)模型和上述目標(biāo)初始詞性權(quán)重對(duì)照表組中的各個(gè)目標(biāo)初始詞性權(quán)重對(duì)照表進(jìn)行調(diào)整,得到上述調(diào)整初始日志序列異常檢測(cè)模型組和調(diào)整初始詞性權(quán)重對(duì)照表組。
12、第二方面,本公開的一些實(shí)施例提供了一種日志異常檢測(cè)裝置,裝置包括:獲取單元,被配置成獲取歷史日志信息序列;模板提取單元,被配置成對(duì)上述歷史日志信息序列中的各個(gè)初始日志信息進(jìn)行模板提取處理,得到日志模板信息序列;特征提取單元,被配置成對(duì)上述日志模板信息序列中的每個(gè)日志模板信息進(jìn)行特征提取處理以生成目標(biāo)日志模板向量,得到目標(biāo)日志模板向量序列;異常檢測(cè)單元,被配置成對(duì)上述目標(biāo)日志模板向量序列進(jìn)行異常檢測(cè)處理,得到異常檢測(cè)結(jié)果。
13、可選地,上述日志異常檢測(cè)裝置還包括發(fā)送單元,被配置成響應(yīng)于確定上述異常檢測(cè)結(jié)果滿足預(yù)設(shè)條件,將上述歷史日志信息序列中最后一個(gè)歷史日志信息發(fā)送至顯示終端。
14、可選地,上述日志模板信息序列中的日志模板信息包括:日志文本單詞集;以及上述特征提取單元被進(jìn)一步配置成:基于上述日志模板信息包括的日志文本單詞集,生成歷史日志模板向量集;對(duì)上述日志文本單詞集中的各個(gè)日志文本單詞進(jìn)行詞性提取處理,得到日志文本單詞詞性信息集;基于預(yù)設(shè)的詞性權(quán)重對(duì)照表和上述日志文本單詞詞性信息集,對(duì)上述歷史日志模板向量集中的各個(gè)歷史日志模板向量進(jìn)行加權(quán)求和處理,得到上述目標(biāo)日志模板向量。
15、可選地,上述異常檢測(cè)單元被進(jìn)一步配置成:將上述目標(biāo)日志模板向量序列中最后一個(gè)目標(biāo)日志模板向量確定為第一目標(biāo)模板向量;將上述第一目標(biāo)模板向量從上述目標(biāo)日志模板向量序列中刪除,得到目標(biāo)歷史模板向量序列;將上述目標(biāo)歷史模板向量序列輸入至預(yù)先訓(xùn)練的日志序列異常檢測(cè)模型,得到第二目標(biāo)模板向量;將上述第一目標(biāo)模板向量和上述第二目標(biāo)模板向量的距離值確定為目標(biāo)模板向量距離值;基于上述目標(biāo)模板向量距離值,生成異常檢測(cè)結(jié)果。
16、可選地,上述日志異常檢測(cè)裝置還包括訓(xùn)練單元,被配置成:獲取樣本日志信息組、初始詞性權(quán)重對(duì)照表組和初始日志序列異常檢測(cè)模型組,其中,上述初始詞性權(quán)重對(duì)照表組中的初始詞性權(quán)重對(duì)照表與上述初始日志序列異常檢測(cè)模型組中的初始日志序列異常檢測(cè)模型一一對(duì)應(yīng);基于上述樣本日志信息組和預(yù)設(shè)的損失函數(shù),對(duì)上述初始詞性權(quán)重對(duì)照表組和初始日志序列異常檢測(cè)模型組進(jìn)行訓(xùn)練處理,得到訓(xùn)練后的日志序列異常檢測(cè)模型和訓(xùn)練后的詞性權(quán)重對(duì)照表。
17、可選地,上述初始日志序列異常檢測(cè)模型組中的初始日志序列異常檢測(cè)模型包括:初始語(yǔ)義提取模型和初始日志預(yù)測(cè)模型,上述樣本日志信息組中的樣本日志信息包括:樣本歷史日志向量序列和樣本目標(biāo)向量;以及上述訓(xùn)練單元被進(jìn)一步配置成:對(duì)于上述初始日志序列異常檢測(cè)模型組中的每個(gè)初始日志序列異常檢測(cè)模型,執(zhí)行以下訓(xùn)練步驟:從樣本日志信息組中選取樣本日志信息;基于初始詞性權(quán)重對(duì)照表組中與初始日志序列異常檢測(cè)模型對(duì)應(yīng)的初始詞性權(quán)重對(duì)照表,對(duì)樣本日志信息包括的樣本歷史日志向量序列和樣本目標(biāo)向量進(jìn)行特征提取處理,得到樣本日志模板向量序列和樣本目標(biāo)模板日志向量;將樣本日志模板向量序列輸入至初始日志序列異常檢測(cè)模型包括的初始語(yǔ)義提取模型,得到樣本日志模板語(yǔ)義信息序列;將樣本日志模板語(yǔ)義信息序列輸入至初始日志序列異常檢測(cè)模型包括的初始日志預(yù)測(cè)模型,得到預(yù)測(cè)日志模板向量序列;基于預(yù)測(cè)日志模板向量序列,生成樣本目標(biāo)預(yù)測(cè)日志模板向量;基于預(yù)設(shè)的損失函數(shù)、樣本目標(biāo)預(yù)測(cè)日志模板向量和樣本目標(biāo)模板日志向量,確定異常檢測(cè)損失值;將所確定的各個(gè)異常檢測(cè)損失值組合為異常檢測(cè)損失值集;基于上述初始詞性權(quán)重對(duì)照表組、上述初始日志序列異常檢測(cè)模型組和上述異常檢測(cè)損失值集,確定日志序列異常檢測(cè)模型和詞性權(quán)重對(duì)照表組。
18、可選地,上述訓(xùn)練單元被進(jìn)一步配置成:響應(yīng)于確定上述異常檢測(cè)損失值集中至少一個(gè)異常檢測(cè)損失值小于目標(biāo)值,將上述異常檢測(cè)損失值集中最小的異常檢測(cè)損失值確定為第一目標(biāo)異常檢測(cè)損失值;將上述初始日志序列異常檢測(cè)模型組中與上述第一目標(biāo)異常檢測(cè)損失值對(duì)應(yīng)的初始日志序列異常檢測(cè)模型確定為日志序列異常檢測(cè)模型;將上述初始詞性權(quán)重對(duì)照表組中與上述日志序列異常檢測(cè)模型對(duì)應(yīng)的初始詞性權(quán)重對(duì)照表確定為詞性權(quán)重對(duì)照表組。
19、可選地,上述日志異常檢測(cè)裝置還包括:調(diào)整單元,被配置成:響應(yīng)于確定上述異常檢測(cè)損失值集中的異常檢測(cè)損失值均大于等于目標(biāo)值,調(diào)整上述初始日志序列異常檢測(cè)模型組中各個(gè)初始日志序列異常檢測(cè)模型的相關(guān)參數(shù)和上述初始詞性權(quán)重對(duì)照表組中各個(gè)初始詞性權(quán)重對(duì)照表的相關(guān)參數(shù),得到調(diào)整后日志序列異常檢測(cè)模型組和調(diào)整后詞性權(quán)重對(duì)照表組;確定單元,被配置成:從上述樣本日志模板信息組中重新選取樣本日志模板信息,將上述調(diào)整初始日志序列異常檢測(cè)模型組確定為初始日志序列異常檢測(cè)模型組以及將上述調(diào)整初始詞性權(quán)重對(duì)照表組確定為初始詞性權(quán)重對(duì)照表組,以供再次執(zhí)行上述訓(xùn)練處理步驟。
20、可選地,上述調(diào)整單元被進(jìn)一步配置成:將上述異常檢測(cè)損失值集中最小的異常檢測(cè)損失值確定為第二目標(biāo)異常檢測(cè)損失值;基于上述第二目標(biāo)異常檢測(cè)損失值,確定目標(biāo)初始日志序列異常檢測(cè)模型和目標(biāo)初始詞性權(quán)重對(duì)照表;基于上述目標(biāo)初始日志序列異常檢測(cè)模型和上述目標(biāo)初始詞性權(quán)重對(duì)照表,生成目標(biāo)初始日志序列異常檢測(cè)模型組和目標(biāo)初始詞性權(quán)重對(duì)照表組;對(duì)上述目標(biāo)初始日志序列異常檢測(cè)模型組中的各個(gè)目標(biāo)初始日志序列異常檢測(cè)模型和上述目標(biāo)初始詞性權(quán)重對(duì)照表組中的各個(gè)目標(biāo)初始詞性權(quán)重對(duì)照表進(jìn)行調(diào)整,得到上述調(diào)整初始日志序列異常檢測(cè)模型組和調(diào)整初始詞性權(quán)重對(duì)照表組。
21、第三方面,本公開的一些實(shí)施例提供了一種電子設(shè)備,包括:一個(gè)或多個(gè)處理器;存儲(chǔ)裝置,其上存儲(chǔ)有一個(gè)或多個(gè)程序,當(dāng)一個(gè)或多個(gè)程序被一個(gè)或多個(gè)處理器執(zhí)行,使得一個(gè)或多個(gè)處理器實(shí)現(xiàn)上述第一方面中任一實(shí)現(xiàn)方式所描述的方法。
22、第四方面,本公開的一些實(shí)施例提供了一種計(jì)算機(jī)可讀介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其中,程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述第一方面中任一實(shí)現(xiàn)方式所描述的方法。
23、第五方面,本公開的一些實(shí)施例提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述第一方面中任一實(shí)現(xiàn)方式所描述的方法。
24、本公開的上述各個(gè)實(shí)施例具有如下有益效果:通過(guò)本公開的一些實(shí)施例的日志異常檢測(cè)方法,可以提高日志異常檢測(cè)的準(zhǔn)確度。具體來(lái)說(shuō),造成日志異常檢測(cè)的準(zhǔn)確度降低的原因在于:常見的深度學(xué)習(xí)網(wǎng)絡(luò)模型沒有考慮提取日志的語(yǔ)義信息作為參考,導(dǎo)致深度學(xué)習(xí)網(wǎng)絡(luò)模型的準(zhǔn)確度降低。基于此,本公開的一些實(shí)施例的日志異常檢測(cè)方法,首先,獲取歷史日志信息序列。然后,對(duì)上述歷史日志信息序列中的各個(gè)歷史日志信息進(jìn)行模板提取處理,得到日志模板信息序列。由此,可以得到能夠表征日志信息的主要信息的日志模板信息。接著,對(duì)上述日志模板信息序列中的每個(gè)日志模板信息進(jìn)行特征提取處理以生成目標(biāo)日志模板向量,得到目標(biāo)日志模板向量序列。由此,可以對(duì)上述日志模板信息進(jìn)行數(shù)字化,可以轉(zhuǎn)換為神經(jīng)網(wǎng)絡(luò)能夠直接處理的日志模板向量。最后,對(duì)上述目標(biāo)日志模板向量序列進(jìn)行異常檢測(cè)處理,得到異常檢測(cè)結(jié)果。由此,可以通過(guò)訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型進(jìn)行日志異常檢測(cè)。因此,本公開的日志異常檢測(cè)方法,通過(guò)模板提取、特征提取,最后進(jìn)行異常檢測(cè)的方式,可以根據(jù)日志文本的單詞信息和語(yǔ)義信息,生成異常檢測(cè)結(jié)果,從而,可以提高日志異常檢測(cè)的準(zhǔn)確度。