本發(fā)明屬于突發(fā)事件情景分析,具體涉及一種燃氣管網(wǎng)突發(fā)事件情景要素關(guān)聯(lián)關(guān)系建立方法。
背景技術(shù):
1、管道是天然氣等能源的主要輸送和分配方式,燃氣管網(wǎng)是城市基礎(chǔ)設施的重要組成部分,對保障國家能源安全和穩(wěn)定供應具有至關(guān)重要的作用。燃氣管網(wǎng)的安全管理直接關(guān)系到公共安全。燃氣管網(wǎng)突發(fā)事件(燃氣泄漏、爆燃、燃氣管道破壞、閃爆、爆炸、坍塌、滑落、著火/燃燒、窒息、中毒、高處墜落、觸電等)可能造成重大人員和財產(chǎn)損失,其情景分析涉及大量專業(yè)知識。燃氣管網(wǎng)突發(fā)事件情景分析是當前安全領(lǐng)域重要的研究熱點,可以為應急救援、標準規(guī)范編制、應急決策、甚至相關(guān)的演練培訓等提供切實的、針對性的指導和建議。
2、在燃氣管網(wǎng)突發(fā)事件情景分析的過程中,需要翻閱大量的歷史事件和相關(guān)的標準規(guī)范,從其中提取出與當前事件情景分析相關(guān)的信息,這些信息中最重要的就是與所分析的情景高度相關(guān)的情景要素及其之間的關(guān)聯(lián)關(guān)系。所述情景要素是表現(xiàn)和反映燃氣管網(wǎng)突發(fā)事件發(fā)生發(fā)展狀態(tài)與趨勢的主要因素。情景要素之間的關(guān)聯(lián)主要通過鄰接矩陣的形式,這種方式只能體現(xiàn)關(guān)聯(lián)關(guān)系的有無,無法通過領(lǐng)域權(quán)重的形式量化情景要素之間的關(guān)聯(lián)程度?,F(xiàn)有的情景要素關(guān)聯(lián)關(guān)系的分析和歸類方法,主要通過人工打分構(gòu)建情景要素之間的關(guān)聯(lián)關(guān)系,這種方式雖然在一定程度上保障了方法的有效性,但得到的關(guān)聯(lián)規(guī)則主觀性高,需要花費非常大的人力、物力、時間,而且不能區(qū)分物聯(lián)感知數(shù)據(jù)和文本數(shù)據(jù)。
技術(shù)實現(xiàn)思路
1、為了解決現(xiàn)有技術(shù)中存在的上述問題,本發(fā)明提供一種燃氣管網(wǎng)突發(fā)事件情景要素關(guān)聯(lián)關(guān)系建立方法。
2、為了實現(xiàn)上述目的,本發(fā)明采用以下技術(shù)方案。
3、一種燃氣管網(wǎng)突發(fā)事件情景要素關(guān)聯(lián)關(guān)系建立方法,包括以下步驟:
4、獲取與燃氣管網(wǎng)突發(fā)事件相關(guān)的文本數(shù)據(jù),并對所述文本數(shù)據(jù)進行分詞處理;
5、計算分詞處理得到的每個詞語的重要性權(quán)重,從所述詞語中篩選出重要性權(quán)重大于設定閾值的詞語,得到情景要素;
6、建立任意兩個情景要素之間的關(guān)聯(lián)關(guān)系,計算所述關(guān)聯(lián)關(guān)系的關(guān)聯(lián)程度,濾除關(guān)聯(lián)程度小于設定閾值的關(guān)聯(lián)關(guān)系,得到情景要素的關(guān)聯(lián)關(guān)系。
7、進一步地,所述文本數(shù)據(jù)從燃氣管網(wǎng)突發(fā)事件數(shù)據(jù)集d中獲取,所述數(shù)據(jù)集d是基于現(xiàn)有數(shù)據(jù)庫,結(jié)合中國燃氣管網(wǎng)事故報告、法律法規(guī)、應急預案、培訓資料、論文專著、標準文獻、新聞數(shù)據(jù)建立的。
8、進一步地,所述方法在進行中文分詞處理后還包括去停用詞處理,刪除對表示文本內(nèi)容意義貢獻較小的詞語。
9、進一步地,所述方法還包括:將所述文本數(shù)據(jù)輸入預訓練模型,得到詞嵌入向量,基于詞嵌入向量對所述文本數(shù)據(jù)進行處理。
10、更進一步地,所述方法還包括按以下方法對預訓練模型進行微調(diào):
11、對輸入文本中選取的關(guān)鍵詞語進行掩蓋,用設定標記替換所述關(guān)鍵詞語,用詞匯表中的索引替換其它詞語;建立標簽數(shù)組,將設定標記位置視為對應關(guān)鍵詞語在所述詞匯表中的索引,其它位置設置為表示忽略的符號標記,得到訓練數(shù)據(jù)集;
12、利用所述訓練數(shù)據(jù)集對預訓練模型進行訓練,得到微調(diào)后的預訓練模型。
13、進一步地,計算每個詞語的重要性權(quán)重的方法包括:
14、s1、基于圖論計算每個詞語的第一重要性權(quán)重k1;
15、以每個詞語作為圖中的一個節(jié)點,并將每個節(jié)點分數(shù)的初始值均設置為1.0;
16、以兩個節(jié)點對應詞語的詞嵌入向量的余弦相似度作為連接所述兩個節(jié)點的邊的權(quán)重,刪除權(quán)重小于設定閾值的邊;
17、按下式更新每個節(jié)點的分數(shù),對節(jié)點分數(shù)進行迭代直到收斂:
18、
19、式中,ws(n+1)(vi)為節(jié)點vi在第n+1迭代步的分數(shù),ws(n)(vj)為節(jié)點vj在第n迭代步的分數(shù),r為阻尼系數(shù),r=0.85,l(vi)為與節(jié)點vi相連的所有節(jié)點的集合,l(vj)為與節(jié)點vj相連的所有節(jié)點的集合,wij為連接節(jié)點vi和vj的邊的權(quán)重;收斂后的節(jié)點分數(shù)即為對應詞語的第一重要性權(quán)重k1;
20、s2、基于改進的tf-idf計算每個詞語的第二重要性權(quán)重k2,計算公式為:
21、
22、式中,n為數(shù)據(jù)集d中的文檔數(shù)量,df(w,d)為數(shù)據(jù)集d中包含詞語w的文檔數(shù)量,fw,d為詞語w在文檔d中出現(xiàn)的次數(shù);
23、s3、對第一重要性權(quán)重k1和第二重要性權(quán)重k2加權(quán)求和,得到第三重要性權(quán)重k3,計算公式為:
24、
25、篩選出k1或k2或k3大于設定閾值的詞語,得到燃氣管網(wǎng)突發(fā)事件的情景要素。
26、更進一步地,所述方法還包括基于領(lǐng)域相關(guān)性對情景要素進行過濾:
27、計算每個情景要素的領(lǐng)域相關(guān)性:
28、
29、式中,dp(a)為情景要素a的領(lǐng)域相關(guān)性,freq(a_d)為情景要素a在數(shù)據(jù)集d中出現(xiàn)的次數(shù),freq(a_d0)為情景要素a在數(shù)據(jù)集d0中出現(xiàn)的次數(shù),數(shù)據(jù)集d0為非燃氣管網(wǎng)突發(fā)事件領(lǐng)域數(shù)據(jù)集;
30、刪除領(lǐng)域相關(guān)性小于設定閾值的情景要素。
31、進一步地,計算情景要素a與b的關(guān)聯(lián)關(guān)系的關(guān)聯(lián)程度的方法包括:
32、計算情景要素a與b的關(guān)聯(lián)關(guān)系的置信度:
33、
34、式中,confidence(a→b)為情景要素a與b的關(guān)聯(lián)關(guān)系的置信度,support(a∩b)為情景要素a和b同時出現(xiàn)的支持度,support(a)為情景要素a出現(xiàn)的支持度;
35、定義時間權(quán)重函數(shù):
36、tw(t)=e-λ(t-t)?????(6)
37、式中,tw(t)為時間權(quán)重,t為當前時間,t為燃氣管網(wǎng)突發(fā)事件發(fā)生的時間,通過基于物聯(lián)監(jiān)測數(shù)據(jù)進行異常檢測獲得,λ為時間衰減系數(shù);
38、計算時間加權(quán)支持度:
39、
40、式中,tws(a)為時間加權(quán)支持度,counti(a)為第i個文檔包含情景要素a的數(shù)量,n為燃氣管網(wǎng)突發(fā)事件數(shù)據(jù)集d中的文檔數(shù)量;
41、定義嚴重性權(quán)重函數(shù):
42、
43、式中,sw(s)為嚴重性權(quán)重,s為燃氣管網(wǎng)突發(fā)事件的嚴重性值,通過計算傷亡和經(jīng)濟損失得到,smax為最大嚴重性值;
44、計算嚴重性加權(quán)支持度:
45、
46、式中,sws(a)為嚴重性加權(quán)支持度;
47、計算情景要素a與b的關(guān)聯(lián)關(guān)系的關(guān)聯(lián)程度:
48、wc(a→b)=confidence(a→b)×tws(a)×sws(a)?????(10)
49、式中,wc(a→b)為情景要素a與b的關(guān)聯(lián)關(guān)系的關(guān)聯(lián)程度。
50、更進一步地,基于物聯(lián)監(jiān)測數(shù)據(jù)進行異常檢測的方法包括:
51、基于從安裝在燃氣管網(wǎng)中的傳感器和監(jiān)測設備采集的數(shù)據(jù),建立時間序列數(shù)據(jù)集x={xi},其中,xi為第i個時間點的多維監(jiān)測數(shù)據(jù),至少包括燃氣壓力、燃氣流量和環(huán)境溫度,其中,i=1,2,......,l,l為數(shù)據(jù)個數(shù);
52、采用單類支持向量機法求解將數(shù)據(jù)集x劃分為正常數(shù)據(jù)和異常數(shù)據(jù)的最大超平面,得到邊界決策函數(shù);
53、將物聯(lián)監(jiān)測數(shù)據(jù)xt輸入邊界決策函數(shù),若函數(shù)值小于0,則xt為異常數(shù)據(jù)。
54、進一步地,所述方法還包括:基于情景要素建立燃氣管網(wǎng)突發(fā)事件情景圖,采用數(shù)字化方式存儲所述情景圖。
55、與現(xiàn)有技術(shù)相比,本發(fā)明具有以下有益效果。
56、本發(fā)明通過獲取與燃氣管網(wǎng)突發(fā)事件相關(guān)的文本數(shù)據(jù),并對所述文本數(shù)據(jù)進行分詞處理,計算每個詞語的重要性權(quán)重,從所述詞語中篩選出重要性權(quán)重大于設定閾值的詞語,得到情景要素,建立任意兩個情景要素之間的關(guān)聯(lián)關(guān)系,計算所述關(guān)聯(lián)關(guān)系的關(guān)聯(lián)程度,濾除關(guān)聯(lián)程度小于設定閾值的關(guān)聯(lián)關(guān)系,得到情景要素的關(guān)聯(lián)關(guān)系。本發(fā)明能夠在有效減少人工參與程度的同時,保證情景要素提取的準確性;能夠通過多層關(guān)聯(lián)規(guī)則構(gòu)建情景要素的關(guān)聯(lián)關(guān)系。