本申請(qǐng)涉及通信領(lǐng)域,具體涉及一種故障定位方法、裝置、設(shè)備及計(jì)算機(jī)程序產(chǎn)品。
背景技術(shù):
1、現(xiàn)有的大型數(shù)據(jù)中心,對(duì)于io的性能、時(shí)延及可靠性的要求不斷提升,綜合考慮高性能、穩(wěn)定性及可擴(kuò)展性等需求,基于fc(fibre?channel,網(wǎng)狀通道)技術(shù)的存儲(chǔ)網(wǎng)絡(luò)仍然是首選的解決方案。由于fc存儲(chǔ)網(wǎng)絡(luò)層次多、架構(gòu)復(fù)雜及fc協(xié)議相對(duì)ip網(wǎng)絡(luò)協(xié)議的封閉性,導(dǎo)致fc網(wǎng)絡(luò)問題排查也非常困難及耗時(shí)。fc網(wǎng)絡(luò)問題排查,一般故障主要依賴硬件監(jiān)控告警信息指向來定位故障問題,一旦出現(xiàn)諸如硬件臨時(shí)錯(cuò)誤等無明顯告警日志信息的復(fù)雜故障場景,由于無明細(xì)日志告警指向,則需依賴專業(yè)人員人工登錄相應(yīng)設(shè)備,分析各級(jí)設(shè)備指標(biāo)之間的物理及邏輯關(guān)系,篩選出具有關(guān)聯(lián)的端口,才能進(jìn)行對(duì)應(yīng)鏈路時(shí)延、流量分析,綜合來分析以及定位fc網(wǎng)絡(luò)中的問題,非常耗時(shí)耗力,且依賴于存儲(chǔ)專業(yè)人員的能力和經(jīng)驗(yàn)。
技術(shù)實(shí)現(xiàn)思路
1、本申請(qǐng)實(shí)施例提供一種故障定位方法、裝置、設(shè)備及計(jì)算機(jī)程序產(chǎn)品,用以解決現(xiàn)有fc網(wǎng)絡(luò)中故障的定位問題耗時(shí)耗力且依賴人工的技術(shù)問題。
2、第一方面,本申請(qǐng)實(shí)施例提供一種故障定位方法,應(yīng)用于目標(biāo)網(wǎng)絡(luò)系統(tǒng),所述目標(biāo)網(wǎng)絡(luò)系統(tǒng)包括前端計(jì)算節(jié)點(diǎn)、交換機(jī)和后端存儲(chǔ)節(jié)點(diǎn);所述故障定位包括:
3、采集所述前端計(jì)算節(jié)點(diǎn)、所述交換機(jī)以及所述后端存儲(chǔ)節(jié)點(diǎn)的基礎(chǔ)數(shù)據(jù);
4、基于預(yù)設(shè)規(guī)則和所述基礎(chǔ)數(shù)據(jù)生成多路徑時(shí)延關(guān)聯(lián)數(shù)據(jù)、拓?fù)鋽?shù)據(jù)和編碼數(shù)據(jù);
5、基于所述多路徑時(shí)延關(guān)聯(lián)數(shù)據(jù)、所述拓?fù)鋽?shù)據(jù)和所述編碼數(shù)據(jù)定位故障位置。
6、在一個(gè)實(shí)施例中,所述采集所述前端計(jì)算節(jié)點(diǎn)、所述交換機(jī)以及所述后端存儲(chǔ)節(jié)點(diǎn)的基礎(chǔ)數(shù)據(jù)包括:
7、采集所述前端計(jì)算節(jié)點(diǎn)的主機(jī)總線適配器端口號(hào);
8、基于路徑采集命令確定各路徑的時(shí)延、系統(tǒng)盤符、主機(jī)端口和存儲(chǔ)端口。
9、在一個(gè)實(shí)施例中,所述基于預(yù)設(shè)規(guī)則和所述基礎(chǔ)數(shù)據(jù)生成多路徑時(shí)延關(guān)聯(lián)數(shù)據(jù)、拓?fù)鋽?shù)據(jù)和編碼數(shù)據(jù)包括:
10、基于所述主機(jī)總線適配器端口號(hào)、各所述路徑的時(shí)延、所述系統(tǒng)盤符、所述主機(jī)端口以及所述存儲(chǔ)端口,確定多路徑時(shí)延關(guān)聯(lián)數(shù)據(jù);
11、基于預(yù)設(shè)路徑編碼規(guī)則和所述基礎(chǔ)數(shù)據(jù)生成多路徑拓?fù)潢P(guān)聯(lián)數(shù)據(jù)和路徑編碼數(shù)據(jù)。
12、在一個(gè)實(shí)施例中,所述基于預(yù)設(shè)路徑編碼規(guī)則和所述基礎(chǔ)數(shù)據(jù)生成多路徑拓?fù)潢P(guān)聯(lián)數(shù)據(jù)和路徑編碼數(shù)據(jù)包括:
13、對(duì)各所述路徑對(duì)應(yīng)的連接設(shè)備名稱、所述主機(jī)總線適配器端口號(hào)以及所述存儲(chǔ)端口進(jìn)行剔重,得到所述主機(jī)總線適配器的端口數(shù)目以及所述存儲(chǔ)端口的數(shù)目;
14、基于所述主機(jī)總線適配器的端口數(shù)目以及所述存儲(chǔ)端口的數(shù)目,對(duì)所述主機(jī)總線適配器端口以及所述存儲(chǔ)端口進(jìn)行編號(hào),得到路徑編碼數(shù)據(jù);
15、確定所述主機(jī)總線適配器端口與所述存儲(chǔ)端口的連接關(guān)系,得到多路徑拓?fù)潢P(guān)聯(lián)數(shù)據(jù)。
16、在一個(gè)實(shí)施例中,所述確定所述主機(jī)總線適配器端口與所述存儲(chǔ)端口的連接關(guān)系,得到多路徑拓?fù)潢P(guān)聯(lián)數(shù)據(jù)包括:
17、基于所述交換機(jī)所連的主機(jī)總線適配器端口和存儲(chǔ)端口,對(duì)所述交換機(jī)的端口進(jìn)行匹配,得到交換機(jī)連接拓?fù)鋽?shù)據(jù);
18、基于所述前端計(jì)算節(jié)點(diǎn)的拓?fù)鋽?shù)據(jù)、所述存儲(chǔ)節(jié)點(diǎn)的拓?fù)鋽?shù)據(jù)以及所述交換機(jī)連接拓?fù)鋽?shù)據(jù),確定多路徑拓?fù)潢P(guān)聯(lián)數(shù)據(jù)。
19、在一個(gè)實(shí)施例中,所述確定所述主機(jī)總線適配器端口與所述存儲(chǔ)端口的連接關(guān)系,得到多路徑拓?fù)潢P(guān)聯(lián)數(shù)據(jù)之后,包括:
20、基于所述交換機(jī)的端口、所述主機(jī)總線適配器端口以及所述存儲(chǔ)端口,對(duì)所述多路徑拓?fù)潢P(guān)聯(lián)數(shù)據(jù)中的路徑進(jìn)行編碼,得到各路徑編碼。
21、在一個(gè)實(shí)施例中,所述基于所述多路徑時(shí)延關(guān)聯(lián)數(shù)據(jù)、所述拓?fù)鋽?shù)據(jù)和所述編碼數(shù)據(jù)定位故障位置包括:
22、獲取故障路徑,基于所述故障路徑確定多路徑數(shù)量變化信息;
23、基于各路徑的時(shí)延以及所述多路徑數(shù)量變化信息,確定故障位置。
24、第二方面,本申請(qǐng)實(shí)施例提供一種故障定位裝置,包括:
25、基礎(chǔ)數(shù)據(jù)采集模塊,用于采集前端計(jì)算節(jié)點(diǎn)、交換機(jī)以及后端存儲(chǔ)節(jié)點(diǎn)的基礎(chǔ)數(shù)據(jù);
26、數(shù)據(jù)生成模塊,用于基于預(yù)設(shè)規(guī)則和所述基礎(chǔ)數(shù)據(jù)生成多路徑時(shí)延關(guān)聯(lián)數(shù)據(jù)、拓?fù)鋽?shù)據(jù)和編碼數(shù)據(jù);
27、故障定位模塊,用于基于所述多路徑時(shí)延關(guān)聯(lián)數(shù)據(jù)、所述拓?fù)鋽?shù)據(jù)和所述編碼數(shù)據(jù)定位故障位置。
28、第三方面,本申請(qǐng)實(shí)施例提供一種設(shè)備,包括處理器和存儲(chǔ)有計(jì)算機(jī)程序的存儲(chǔ)器,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)第一方面所述的故障定位方法。
29、第四方面,本申請(qǐng)實(shí)施例提供一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)第一方面所述的故障定位方法。
30、本申請(qǐng)實(shí)施例提供的故障定位方法、裝置、設(shè)備及計(jì)算機(jī)程序產(chǎn)品,本申請(qǐng)實(shí)施例提供的故障定位方法應(yīng)用于包括前端計(jì)算節(jié)點(diǎn)、交換機(jī)和后端存儲(chǔ)節(jié)點(diǎn)的目標(biāo)網(wǎng)絡(luò)系統(tǒng),首先,采集目標(biāo)網(wǎng)絡(luò)系統(tǒng)中前端計(jì)算節(jié)點(diǎn)、交換機(jī)和后端存儲(chǔ)節(jié)點(diǎn)的一些基礎(chǔ)數(shù)據(jù),然后在采集到的基礎(chǔ)數(shù)據(jù)的基礎(chǔ)上結(jié)合預(yù)設(shè)規(guī)則,生成多路徑時(shí)延關(guān)聯(lián)數(shù)據(jù)、拓?fù)鋽?shù)據(jù)和編碼數(shù)據(jù);最后基于多路徑時(shí)延關(guān)聯(lián)數(shù)據(jù)、拓?fù)鋽?shù)據(jù)和編碼數(shù)據(jù)定位出目標(biāo)網(wǎng)絡(luò)系統(tǒng)中的故障位置。本申請(qǐng)實(shí)施例提供的故障定位方法不依賴于人工且不耗時(shí)耗力。
1.一種故障定位方法,其特征在于,應(yīng)用于目標(biāo)網(wǎng)絡(luò)系統(tǒng),所述目標(biāo)網(wǎng)絡(luò)系統(tǒng)包括前端計(jì)算節(jié)點(diǎn)、交換機(jī)和后端存儲(chǔ)節(jié)點(diǎn);所述故障定位包括:
2.根據(jù)權(quán)利要求1所述的故障定位方法,其特征在于,所述采集所述前端計(jì)算節(jié)點(diǎn)、所述交換機(jī)以及所述后端存儲(chǔ)節(jié)點(diǎn)的基礎(chǔ)數(shù)據(jù)包括:
3.根據(jù)權(quán)利要求2所述的故障定位方法,其特征在于,所述基于預(yù)設(shè)規(guī)則和所述基礎(chǔ)數(shù)據(jù)生成多路徑時(shí)延關(guān)聯(lián)數(shù)據(jù)、拓?fù)鋽?shù)據(jù)和編碼數(shù)據(jù)包括:
4.根據(jù)權(quán)利要求3所述的故障定位方法,其特征在于,所述基于預(yù)設(shè)路徑編碼規(guī)則和所述基礎(chǔ)數(shù)據(jù)生成多路徑拓?fù)潢P(guān)聯(lián)數(shù)據(jù)和路徑編碼數(shù)據(jù)包括:
5.根據(jù)權(quán)利要求4所述的故障定位方法,其特征在于,所述確定所述主機(jī)總線適配器端口與所述存儲(chǔ)端口的連接關(guān)系,得到多路徑拓?fù)潢P(guān)聯(lián)數(shù)據(jù)包括:
6.根據(jù)權(quán)利要求5所述的故障定位方法,其特征在于,所述確定所述主機(jī)總線適配器端口與所述存儲(chǔ)端口的連接關(guān)系,得到多路徑拓?fù)潢P(guān)聯(lián)數(shù)據(jù)之后,包括:
7.根據(jù)權(quán)利要求6所述的故障定位方法,其特征在于,所述基于所述多路徑時(shí)延關(guān)聯(lián)數(shù)據(jù)、所述拓?fù)鋽?shù)據(jù)和所述編碼數(shù)據(jù)定位故障位置包括:
8.一種故障定位裝置,其特征在于,包括:
9.一種電子設(shè)備,包括處理器和存儲(chǔ)有計(jì)算機(jī)程序的存儲(chǔ)器,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)權(quán)利要求1至7任一項(xiàng)所述的故障定位方法。
10.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至7任一項(xiàng)所述的故障定位方法。