本申請涉及計(jì)算機(jī),具體涉及一種系統(tǒng)故障檢測方法、裝置、設(shè)備和存儲介質(zhì)。
背景技術(shù):
1、隨著電信運(yùn)營商業(yè)務(wù)發(fā)展變得越來越復(fù)雜,通信產(chǎn)品、解決方案售賣涉及到越來越多的信息化系統(tǒng),各個系統(tǒng)相互串接,當(dāng)業(yè)務(wù)受理過程中出現(xiàn)信息化系統(tǒng)故障時,排查問題復(fù)雜度增加,加之現(xiàn)在的微服務(wù)架構(gòu)成為主流。加劇了傳統(tǒng)排查手段“逐一排查系統(tǒng)報(bào)錯日志,檢查指標(biāo)數(shù)據(jù),結(jié)合人員的經(jīng)驗(yàn),定界故障的系統(tǒng)”的實(shí)現(xiàn)復(fù)雜度,對人員的技術(shù)和經(jīng)驗(yàn)要求也更高。
2、面對日益增長的系統(tǒng)數(shù)量、微服務(wù)架構(gòu)下的原子服務(wù)數(shù)量以及系統(tǒng)間日益復(fù)雜的相互調(diào)用關(guān)系,從海量的服務(wù)端、消費(fèi)端,海量的微服務(wù)容器節(jié)點(diǎn)中完成快速故障定界成為系統(tǒng)運(yùn)維人員工作的重點(diǎn)和難點(diǎn)。目前,故障感知和定位技術(shù)主要從時域角度出發(fā),通過觀測和判斷條件,對系統(tǒng)故障的出現(xiàn)體現(xiàn)出隨機(jī)性和系統(tǒng)間的離散性。同時,依賴專業(yè)人士對系統(tǒng)故障進(jìn)行判斷,降低了系統(tǒng)故障檢測的準(zhǔn)確性。
技術(shù)實(shí)現(xiàn)思路
1、本申請實(shí)施例提供一種系統(tǒng)故障檢測方法、裝置、設(shè)備和存儲介質(zhì),用以解決系統(tǒng)故障檢測的準(zhǔn)確性低的問題。
2、第一方面,本申請實(shí)施例提供一種系統(tǒng)故障檢測方法,包括:
3、確定與待核驗(yàn)系統(tǒng)關(guān)聯(lián)的至少一個關(guān)聯(lián)系統(tǒng);
4、采集每個所述關(guān)聯(lián)系統(tǒng)在目標(biāo)采樣時間段內(nèi)的日志信息;所述目標(biāo)采樣時間段表征與所述待核驗(yàn)系統(tǒng)具有相同采樣時間的時間段;
5、確定每個所述關(guān)聯(lián)系統(tǒng)的日志信息中的錯誤字段的占比;
6、若至少一個所述關(guān)聯(lián)系統(tǒng)的所述占比表征為所述關(guān)聯(lián)系統(tǒng)故障,則確定所述待核驗(yàn)系統(tǒng)為故障系統(tǒng)。
7、在一個實(shí)施例中,所述確定與待核驗(yàn)系統(tǒng)關(guān)聯(lián)的至少一個關(guān)聯(lián)系統(tǒng),包括:
8、獲取所述待核驗(yàn)系統(tǒng)的第一特征頻譜向量,以及至少一個待檢測系統(tǒng)的第二特征頻譜向量;
9、確定所述第一特征頻譜向量與每個所述第二特征頻譜向量的向量相似度;
10、將所述向量相似度大于第一設(shè)定閾值的至少一個所述待檢測系統(tǒng)作為所述關(guān)聯(lián)系統(tǒng)。
11、在一個實(shí)施例中,確定所述待核驗(yàn)系統(tǒng),包括:
12、采集待檢測系統(tǒng)的歷史流量數(shù)據(jù)和實(shí)時流量數(shù)據(jù);
13、基于所述歷史流量數(shù)據(jù),確定所述待檢測系統(tǒng)的第一特征頻譜,以及基于所述實(shí)時流量數(shù)據(jù),確定所述待檢測系統(tǒng)的第二特征頻譜;
14、確定所述第一特征頻譜與所述第二特征頻譜之間的差異分值;
15、若所述差異分值大于設(shè)定分值,則確定所述待檢測系統(tǒng)為所述待核驗(yàn)系統(tǒng)。
16、在一個實(shí)施例中,所述確定所述第一特征頻譜與所述第二特征頻譜之間的差異分值,包括:
17、獲取所述第一特征頻譜的第一頻率和第一幅值,以及所述第二特征頻譜的第二頻率和第二幅值;
18、確定所述第一頻率與所述第二頻率的第一偏離值,以及所述第一幅值與所述第二幅值的第二偏離值;
19、基于所述第一頻率、所述第一幅值、所述第一偏離值、所述第二偏離值、頻率權(quán)重以及幅值權(quán)重,確定所述差異分值。
20、在一個實(shí)施例中,所述基于所述歷史流量數(shù)據(jù),確定所述待檢測系統(tǒng)的第一特征頻譜,包括:
21、對所述歷史流量數(shù)據(jù)進(jìn)行時頻變換,得到頻譜數(shù)據(jù);
22、采用設(shè)定的幅值閾值,對所述頻譜數(shù)據(jù)進(jìn)行特征頻譜提取,得到所述待檢測系統(tǒng)的第一特征頻譜。
23、在一個實(shí)施例中,所述基于所述歷史流量數(shù)據(jù),確定所述待檢測系統(tǒng)的第一特征頻譜,以及基于所述實(shí)時流量數(shù)據(jù),確定所述待檢測系統(tǒng)的第二特征頻譜之后,所述方法還包括:
24、確定所述第一特征頻譜與所述第二特征頻譜的相似度;
25、若所述相似度小于第二設(shè)定閾值,則確定所述待檢測系統(tǒng)存在頻譜突變,并輸出頻譜突變預(yù)警信息。
26、在一個實(shí)施例中,所述確定每個所述關(guān)聯(lián)系統(tǒng)的日志信息中的錯誤字段的占比,包括:
27、對所述日志信息進(jìn)行分詞處理;
28、采用預(yù)先配置的字段列表,搜索分詞處理后的日志信息中的所述錯誤字段,并基于搜索結(jié)果統(tǒng)計(jì)所述錯誤字段的數(shù)量;
29、基于所述錯誤字段的數(shù)量以及分詞總數(shù),確定所述占比。
30、第二方面,本申請實(shí)施例提供一種系統(tǒng)故障檢測裝置,包括:
31、關(guān)聯(lián)系統(tǒng)確定模塊,用于確定與待核驗(yàn)系統(tǒng)關(guān)聯(lián)的至少一個關(guān)聯(lián)系統(tǒng);
32、日志信息采集模塊,用于采集每個所述關(guān)聯(lián)系統(tǒng)在目標(biāo)采樣時間段內(nèi)的日志信息;所述目標(biāo)采樣時間段表征與所述待核驗(yàn)系統(tǒng)具有相同采樣時間的時間段;
33、占比確定模塊,用于確定每個所述關(guān)聯(lián)系統(tǒng)的日志信息中的錯誤字段的占比;
34、故障檢測模塊,用于若至少一個所述關(guān)聯(lián)系統(tǒng)的所述占比表征為所述關(guān)聯(lián)系統(tǒng)故障,則確定所述待核驗(yàn)系統(tǒng)為故障系統(tǒng)。
35、第三方面,本申請實(shí)施例提供一種電子設(shè)備,包括處理器和存儲有計(jì)算機(jī)程序的存儲器,所述處理器執(zhí)行所述程序時實(shí)現(xiàn)第一方面所述的系統(tǒng)故障檢測方法的步驟。
36、第四方面,本申請實(shí)施例提供一種非暫態(tài)計(jì)算機(jī)可讀存儲介質(zhì),其上存儲有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時實(shí)現(xiàn)第一方面所述的系統(tǒng)故障檢測方法的步驟。
37、本申請實(shí)施例提供的系統(tǒng)故障檢測方法、裝置、設(shè)備和存儲介質(zhì),通過確定與待核驗(yàn)系統(tǒng)關(guān)聯(lián)的至少一個關(guān)聯(lián)系統(tǒng);采集每個關(guān)聯(lián)系統(tǒng)在目標(biāo)采樣時間段內(nèi)的日志信息;目標(biāo)采樣時間段表征與待核驗(yàn)系統(tǒng)具有相同采樣時間的時間段;確定每個關(guān)聯(lián)系統(tǒng)的日志信息中的錯誤字段的占比;若至少一個關(guān)聯(lián)系統(tǒng)的占比表征為關(guān)聯(lián)系統(tǒng)故障,則確定待核驗(yàn)系統(tǒng)為故障系統(tǒng)。本申請通過采集與待核驗(yàn)系統(tǒng)相關(guān)的關(guān)聯(lián)系統(tǒng)的日志信息,基于日志信息中錯誤字段的占比對待核驗(yàn)進(jìn)行二次復(fù)核,減少了系統(tǒng)故障判斷時對專業(yè)人員的經(jīng)驗(yàn)依賴,提高系統(tǒng)故障檢測結(jié)果準(zhǔn)確性和便捷性。
1.一種系統(tǒng)故障檢測方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的系統(tǒng)故障檢測方法,其特征在于,所述確定與待核驗(yàn)系統(tǒng)關(guān)聯(lián)的至少一個關(guān)聯(lián)系統(tǒng),包括:
3.根據(jù)權(quán)利要求1所述的系統(tǒng)故障檢測方法,其特征在于,確定所述待核驗(yàn)系統(tǒng),包括:
4.根據(jù)權(quán)利要求3所述的系統(tǒng)故障檢測方法,其特征在于,所述確定所述第一特征頻譜與所述第二特征頻譜之間的差異分值,包括:
5.根據(jù)權(quán)利要求3所述的系統(tǒng)故障檢測方法,其特征在于,所述基于所述歷史流量數(shù)據(jù),確定所述待檢測系統(tǒng)的第一特征頻譜,包括:
6.根據(jù)權(quán)利要求3所述的系統(tǒng)故障檢測方法,其特征在于,所述基于所述歷史流量數(shù)據(jù),確定所述待檢測系統(tǒng)的第一特征頻譜,以及基于所述實(shí)時流量數(shù)據(jù),確定所述待檢測系統(tǒng)的第二特征頻譜之后,所述方法還包括:
7.根據(jù)權(quán)利要求1所述的系統(tǒng)故障檢測方法,其特征在于,所述確定每個所述關(guān)聯(lián)系統(tǒng)的日志信息中的錯誤字段的占比,包括:
8.一種系統(tǒng)故障檢測裝置,其特征在于,包括:
9.一種電子設(shè)備,包括處理器和存儲有計(jì)算機(jī)程序的存儲器,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時實(shí)現(xiàn)權(quán)利要求1至7任一項(xiàng)所述的系統(tǒng)故障檢測方法的步驟。
10.一種非暫態(tài)計(jì)算機(jī)可讀存儲介質(zhì),其上存儲有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時實(shí)現(xiàn)權(quán)利要求1至7任一項(xiàng)所述的系統(tǒng)故障檢測方法的步驟。