本發(fā)明涉及質譜穩(wěn)定性監(jiān)測,尤其涉及一種基于質譜檢測的穩(wěn)定性監(jiān)測方法及系統(tǒng)。
背景技術:
1、質譜檢測技術作為一種強有力的分析工具,被廣泛應用于各種科學研究和工業(yè)生產中。它通過測量離子化樣品的質量-電荷比來鑒定和定量分析化合物。質譜檢測具有高靈敏度、高分辨率和高通量的特點,能夠提供豐富的結構和定量信息。盡管質譜技術已經(jīng)相對成熟,但在實際應用中,數(shù)據(jù)的復雜性和多樣性依然是一個重大挑戰(zhàn)。質譜數(shù)據(jù)不僅包含了樣品的豐富信息,還常常伴隨著噪聲、漂移和其他不確定因素,這些因素對數(shù)據(jù)分析的準確性和穩(wěn)定性提出了更高的要求。因此如何有效地處理和分析這些數(shù)據(jù),特別是監(jiān)測數(shù)據(jù)的穩(wěn)定性,成為了在一個重要的研究課題。
2、現(xiàn)有的基于質譜檢測的穩(wěn)定性監(jiān)測方法及系統(tǒng)無法根據(jù)質譜數(shù)據(jù)的不同特點自動調整算法參數(shù),降低模型在不同質譜數(shù)據(jù)集上的通用性和適應性,模型在捕捉數(shù)據(jù)依賴性關系時的穩(wěn)定性和可靠性差;此外,現(xiàn)有的基于質譜檢測的穩(wěn)定性監(jiān)測方法及系統(tǒng)無法在多個層次上識別異常數(shù)據(jù)點,降低異常檢測的準確性和魯棒性,且不適用于高通量質譜檢測環(huán)境;為此,我們提出一種基于質譜檢測的穩(wěn)定性監(jiān)測方法及系統(tǒng)。
技術實現(xiàn)思路
1、本發(fā)明的目的是為了解決現(xiàn)有技術中存在的缺陷,而提出的一種基于質譜檢測的穩(wěn)定性監(jiān)測方法及系統(tǒng)。
2、為了實現(xiàn)上述目的,本發(fā)明采用了如下技術方案:
3、一種基于質譜檢測的穩(wěn)定性監(jiān)測方法,該監(jiān)測方法具體步驟如下:
4、p1、預處理質譜數(shù)據(jù)并提取數(shù)據(jù)特征。
5、作為本發(fā)明的進一步方案,p1所述提取數(shù)據(jù)特征具體步驟如下:
6、步驟一:獲取質譜數(shù)據(jù),并構建質譜圖像,其中質譜圖像的橫軸為質荷比,縱軸為信號強度,再采用高斯濾波器對質譜數(shù)據(jù)進行平滑處理,去除噪聲,并使用多項式擬合對基線進行校正;
7、步驟二:構建n×n的窗口,并將窗口初始位置放置于質譜圖像的左上角,即坐標處,之后依據(jù)需求對窗口進行橫向逐點滑動或縱向逐點滑動,直至滑動至質樸圖像結束;
8、步驟三:每次滑動窗口時,收集窗口中心數(shù)據(jù)點坐標以及其余鄰域數(shù)據(jù)點坐標,并計算窗口中心數(shù)據(jù)點與窗口中其余點的差值,之后根據(jù)計算得到的差值,進行二值化處理,若中心點的值大于或等于鄰域點,則差值為1,否則為0;
9、步驟四:將所有鄰域點的二值化結果按順時針或逆時針順序組合成一個二進制數(shù),以獲取每個質譜數(shù)據(jù)點的lbp特征值,之后統(tǒng)計圖像中所有l(wèi)bp模式的出現(xiàn)頻率,構建lbp直方圖作為紋理特征向量,再將提取的lbp特征構建成數(shù)據(jù)矩陣,其中每行代表一個質譜樣本,每列代表一個特征;
10、步驟五:提取每組實驗樣本質譜圖像中的特征峰及其強度值,將每個樣本的特征強度值排列成一行,形成響應矩陣的一行,再將所有樣本的特征排列組合在一起,形成完整的響應矩陣,之后計算特征矩陣和響應矩陣的協(xié)方差矩陣;
11、步驟六:通過奇異值分解獲取協(xié)方差矩陣的特征向量,并將其作為權重向量,再將原始數(shù)據(jù)投影到新的潛變量空間,以獲取降維后的特征矩陣,并將降維后的特征矩陣作為此次質譜數(shù)據(jù)的數(shù)據(jù)特征。
12、作為本發(fā)明的進一步方案,步驟四所述lbp特征值具體計算公式如下:
13、;
14、式中,代表在坐標處的中心像素的lbp值;代表當前n×n窗口的中心點坐標;代表當前窗口的大?。淮矶祷瘮?shù);代表點處的信號強度;代表當前n×n窗口中第個領域點坐標;代表二進制數(shù)的權重,其中是鄰域點的編號。
15、p2、通過三維可視化模型展示各質譜數(shù)據(jù);
16、p3、捕捉不同質譜數(shù)據(jù)之間的依賴關系并進行非線性降維。
17、作為本發(fā)明的進一步方案,p3所述捕捉不同質譜數(shù)據(jù)之間的依賴關系具體步驟如下:
18、步驟1:通過文獻調研、專家咨詢以及歷史實驗結果收集質譜檢測領域知識,計算各特征之間的相關系數(shù),并識別可能的依賴關系,再使用卡方檢驗方法測試特征之間的條件獨立性,對特征進行聚類,獲取各組特征之間的潛在關系,之后使用格蘭杰因果關系檢驗方法識別潛在的因果關系;
19、步驟2:將每個從質譜數(shù)據(jù)中提取的數(shù)據(jù)特征作為一個節(jié)點,根據(jù)專家意見和文獻調研的結果,初步連接一些顯著依賴的特征,再依據(jù)相關系數(shù)和條件獨立性測試的結果,建立初始邊連接,檢查初始概率模型結構的合理性,根據(jù)數(shù)據(jù)統(tǒng)計結果和專家意見,修正初始概率模型結構;
20、步驟3:計算當前模型結構的bic值,即模型結構評分值,在當前模型結構中,選擇一對沒有直接連接的節(jié)點作為候選邊,在和之間添加一條有向邊或,計算新結構的bic值,并與當前結構的bic值進行比較;
21、步驟4:在當前模型結構中,選擇一條現(xiàn)有的有向邊作為候選邊,并模擬刪除該有向邊,再計算新結構的bic值,并與當前結構的bic值進行比較,在當前模型結構中,選擇一條現(xiàn)有的有向邊作為候選邊,反轉該有向邊,計算新結構的bic值,并與當前結構的bic值進行比較;
22、步驟5:比較添加邊、刪除邊以及反轉邊操作的評分變化,選擇能夠最大化降低bic值的操作,再根據(jù)最優(yōu)操作更新模型結構,依據(jù)概率模型中的節(jié)點數(shù)量和邊數(shù)量初始化組個體,并隨機初始化每組個體位置,其中位置表示模型結構,用一個二進制矩陣表示各網(wǎng)絡結構,矩陣元素表示邊的存在與否;
23、步驟6:對于每組個體,計算其對應模型結構的bic值作為亮度,其中模型bic值越小,該個體亮度值越高,比較各個體亮度值,再計算各組個體之間的距離,并將依據(jù)個體向更亮的個體移動的更新規(guī)則,調整各組個體位置,重復計算各組個體亮度值,并更新個體位置信息,直至達到預設最大迭代次數(shù),對更新后的位置對應的模型結構進行隨機擾動后,獲取最終概率模型結構;
24、步驟7:在最終概率模型通過條件獨立性測試來確認特征之間的依賴關系,之后通過馬爾科夫鏈蒙特卡洛方法對各數(shù)據(jù)特征進行概率推理,并計算某些特征的后驗概率以進行預測或分類,對捕捉到的特征依賴關系進行解釋,以獲取特征之間的相互作用信息。
25、作為本發(fā)明的進一步方案,步驟3所述bic值具體計算公式如下:
26、;
27、式中,代表模型結構評分值;代表觀測數(shù)據(jù)集,包含所有質譜數(shù)據(jù)樣本;代表概率模型的參數(shù)集;代表節(jié)點之間的有向邊關系;代表數(shù)據(jù)在參數(shù)和結構下的似然;代表參數(shù)的數(shù)量;代表數(shù)據(jù)集中樣本的數(shù)量;
28、步驟6中所述個體位置更新具體計算公式如下:
29、;
30、;
31、;
32、式中,代表個體和個體之間的距離;代表鄰接矩陣的維度;代表質譜數(shù)據(jù)的第個維度;代表個體對應的鄰接矩陣的第個元素;代表個體對應的鄰接矩陣的第個元素;代表個體對個體的吸引度;代表最大吸引度常數(shù);代表光強吸收系數(shù),用于決定吸引度隨距離的衰減速度;代表自然對數(shù)的底數(shù);代表更新后的模型結構;代表個體當前的模型結構;代表個體當前的模型結構。
33、p4、識別不同的穩(wěn)定性狀態(tài)并分析質譜數(shù)據(jù)中的群體結構;
34、p5、對聚類結果進行建模以處理數(shù)據(jù)的多峰特性;
35、p6、根據(jù)質譜特征和聚類結果進行實時穩(wěn)定性監(jiān)測。
36、一種基于質譜檢測的穩(wěn)定性監(jiān)測系統(tǒng),包括采集預處理模塊、提取降維模塊、依賴捕捉模塊、結構優(yōu)化模塊、異常識別模塊、報告生成模塊、捕捉檢測模塊、自適應調整模塊以及可視化模塊;
37、所述采集處理模塊用于從質譜儀中采集原始質譜數(shù)據(jù)并進行清洗和標準化;
38、所述提取降維模塊用于提取質譜數(shù)據(jù)的紋理特征,捕捉質譜圖中的局部模式,并對提取的特征進行降維,減少冗余信息;
39、所述依賴捕捉模塊用于構建質譜數(shù)據(jù)的概率模型,捕捉不同特征之間的依賴關系;
40、所述結構優(yōu)化模塊用于優(yōu)化概率模型結構,并對優(yōu)化后的模型結構進行評價;
41、所述異常識別模塊用于檢測質譜數(shù)據(jù)中的異常點,識別潛在的質量問題。
42、作為本發(fā)明的進一步方案,所述異常識別模塊識別潛在的質量問題具體步驟如下:
43、步驟?。韩@取預處理后的質譜數(shù)據(jù)集,其中表示第個質譜數(shù)據(jù)點,包含多個特征,之后選擇多個初始聚類中心,再計算每個數(shù)據(jù)點到聚類中心的距離,并將各組質譜數(shù)據(jù)分配到最近的聚類中心,并更新每個聚類的中心為該聚類中所有點的平均值;
44、步驟ⅱ:重復尋找聚類中心,并分配質譜數(shù)據(jù)點,直到聚類中心收斂到預設閾值內,根據(jù)聚類結果,識別不屬于任何主要聚類的點或處于聚類邊緣的點,并將其標記為異常點;
45、步驟ⅲ:計算并記錄未標記質譜數(shù)據(jù)點與異常數(shù)據(jù)點之間的相似度,以構建標準拉普拉斯矩陣,再對拉普拉斯矩陣進行特征值分解,得到多組最小特征值對應的特征向量,構成特征矩陣,之后設置各數(shù)據(jù)點鄰域半徑,以及質譜數(shù)據(jù)點成為核心點所需的最小鄰居數(shù);
46、步驟ⅳ:計算特征矩陣中每對數(shù)據(jù)點之間的距離,同時計算每個數(shù)據(jù)點鄰域半徑內的鄰居數(shù),若鄰居數(shù)不小于,則該點為核心點,從一個核心點開始,將所有在鄰域半徑內的點加入到當前聚類中,若新加入的點也是核心點,則繼續(xù)擴展,重復選擇核心點并創(chuàng)建新聚類,直至沒有新的點可加入;
47、步驟ⅴ:檢測聚類完成后的各組質譜數(shù)據(jù)點,若一個點既不是核心點,也不是任何核心點的鄰居,則該點被標記為異常點,再通過構建的概率模型計算其余每個節(jié)點的條件概率表,以及各數(shù)據(jù)點在概率模型中的聯(lián)合概率以及異常概率,若異常概率高于異常閾值時,識別該點為異常點;
48、步驟ⅵ:對檢測出的各組異常點進行解釋說明,再通過報告生成模塊依據(jù)用戶需求通過圖表的形式對各組質譜數(shù)據(jù)的檢測結果,進行可視化展示,并通過短信、郵箱以及報警的方式告知用戶存在穩(wěn)定性異常。
49、所述聚類分析模塊用于對質譜數(shù)據(jù)進行檢測分析,識別數(shù)據(jù)中的潛在模式和結構;
50、所述報告生成模塊用于自動生成質譜檢測結果報告,提供詳細的分析結果和建議;
51、所述捕捉檢測模塊用于識別捕捉質譜數(shù)據(jù)中的社團結構以及多峰特性。
52、作為本發(fā)明的進一步方案,所述捕捉檢測模塊識別捕捉質譜數(shù)據(jù)中的社團結構以及多峰特性具體步驟如下:
53、第一步:捕捉檢測模塊初始化一組空的網(wǎng)絡圖,將質譜數(shù)據(jù)點表示為網(wǎng)絡圖中的節(jié)點,并根據(jù)數(shù)據(jù)點之間的相似度或距離,構建節(jié)點之間的邊,計算所有節(jié)點對之間通過邊的最短路徑數(shù),即邊介數(shù),并移除邊介數(shù)最大的邊;
54、第二步:移除完成后,重新計算網(wǎng)絡圖各邊的邊介數(shù),并移除邊介數(shù)最大的邊,重復計算各邊的邊介數(shù),以及移除最大邊介數(shù),直至網(wǎng)絡圖分裂為多個社團,計算每個社團的內部特征;
55、第三步:構建高斯混合模型,定義多個高斯成分,每個成分表示一個高斯分布,再使用期望最大化算法計算數(shù)據(jù)點屬于每個高斯成分的后驗概率,并根據(jù)后驗概率更新高斯混合模型參數(shù);
56、第四步:通過更新后的高斯混合模型計算每個質譜數(shù)據(jù)點的概率分布,再分析高斯混合模型中每個高斯成分,識別質譜數(shù)據(jù)的多峰特性,再根據(jù)每個高斯成分的均值和協(xié)方差,確定質譜數(shù)據(jù)的不同峰值位置和分布形態(tài)。
57、所述自適應調整模塊用于動態(tài)調整模型參數(shù),并實時更新檢測算法;
58、所述可視化模塊用于構建虛擬現(xiàn)實場景,展示質譜圖。
59、相比于現(xiàn)有技術,本發(fā)明的有益效果在于:
60、1、該基于質譜檢測的穩(wěn)定性監(jiān)測方法通過文獻調研、專家咨詢以及歷史實驗結果收集質譜檢測領域知識,計算各特征之間的相關系數(shù),并識別可能的依賴關系,再使用卡方檢驗方法測試特征之間的條件獨立性,對特征進行聚類,獲取各組特征之間的潛在關系,之后使用格蘭杰因果關系檢驗方法識別潛在的因果關系,將每個從質譜數(shù)據(jù)中提取的數(shù)據(jù)特征作為一個節(jié)點,初步連接一些顯著依賴的特征,再依據(jù)相關系數(shù)和條件獨立性測試的結果,建立初始邊連接,檢查初始概率模型結構的合理性,根據(jù)數(shù)據(jù)統(tǒng)計結果和專家意見,修正初始概率模型結構,計算當前模型結構的bic值,即模型結構評分值,在當前模型結構中,隨機添加一條有向邊,計算新結構的bic值,并與當前結構的bic值進行比較,在當前模型結構中,進行添加邊、刪除邊以及反轉邊操作,并比較各操作的評分變化,選擇能夠最大化降低bic值的操作,再根據(jù)最優(yōu)操作更新模型結構,依據(jù)概率模型中的節(jié)點數(shù)量和邊數(shù)量初始化多組個體,并隨機初始化每組個體位置,其中位置表示模型結構,用一個二進制矩陣表示各網(wǎng)絡結構,矩陣元素表示邊的存在與否,對于每組個體,計算其對應模型結構的bic值作為亮度,其中模型bic值越小,該個體亮度值越高,比較各個體亮度值,調整各組個體位置,重復計算各組個體亮度值,并更新個體位置信息,直至達到預設最大迭代次數(shù),對更新后的位置對應的模型結構進行隨機擾動后,獲取最終概率模型結構,在最終概率模型通過條件獨立性測試來確認特征之間的依賴關系,之后通過馬爾科夫鏈蒙特卡洛方法對各數(shù)據(jù)特征進行概率推理,并計算某些特征的后驗概率以進行預測或分類,對捕捉到的特征依賴關系進行解釋,以獲取特征之間的相互作用信息,能夠根據(jù)質譜數(shù)據(jù)的不同特點自動調整算法參數(shù),提高了模型在不同質譜數(shù)據(jù)集上的通用性和適應性,能夠更好地捕捉質譜數(shù)據(jù)中的變化和趨勢,增強模型在捕捉數(shù)據(jù)依賴性關系時的穩(wěn)定性和可靠性。
61、2、該基于質譜檢測的穩(wěn)定性監(jiān)測系統(tǒng)獲取預處理后的質譜數(shù)據(jù)集,之后選擇多個初始聚類中心,再計算每個數(shù)據(jù)點到聚類中心的距離,并將各組質譜數(shù)據(jù)分配到最近的聚類中心,并更新每個聚類的中心為該聚類中所有點的平均值,重復尋找聚類中心,并分配質譜數(shù)據(jù)點,直到聚類中心收斂到預設閾值內,識別不屬于任何主要聚類的點或處于聚類邊緣的點,并將其標記為異常點,計算各數(shù)據(jù)點之間的相似度,以構建標準拉普拉斯矩陣,再對拉普拉斯矩陣進行特征值分解,得到多組最小特征值對應的特征向量,構成特征矩陣,之后設置各數(shù)據(jù)點鄰域半徑,以及質譜數(shù)據(jù)點成為核心點所需的最小鄰居數(shù),找尋特征矩陣中各核心點,從一個核心點開始,將所有在鄰域半徑內的點加入到當前聚類中,若新加入的點也是核心點,則繼續(xù)擴展,重復選擇核心點并創(chuàng)建新聚類,直至沒有新的點可加入,檢測聚類完成后的各組質譜數(shù)據(jù)點,若一個點既不是核心點,也不是任何核心點的鄰居,則該點被標記為異常點,再通過構建的概率模型計算其余每個節(jié)點的條件概率表,以及各數(shù)據(jù)點在概率模型中的聯(lián)合概率以及異常概率,若異常概率高于異常閾值時,識別該點為異常點,對檢測出的各組異常點進行解釋說明,再通過報告生成模塊依據(jù)用戶需求通過圖表的形式對各組質譜數(shù)據(jù)的檢測結果,進行可視化展示,并通過短信、郵箱以及報警的方式告知用戶存在穩(wěn)定性異常,能夠在多個層次上識別異常數(shù)據(jù)點,提供更精確的異常檢測,提升異常檢測的準確性和魯棒性,能夠高效地處理大量質譜數(shù)據(jù),適用于高通量質譜檢測環(huán)境。。