本發(fā)明涉及水生態(tài)環(huán)境監(jiān)測,特別是一種基于自適應(yīng)模型和動態(tài)數(shù)據(jù)融合的水生態(tài)環(huán)境監(jiān)測數(shù)據(jù)預(yù)測方法。
背景技術(shù):
1、我國目前水生態(tài)環(huán)境保護(hù)主要包含兩大方面:一是生態(tài)防止與治理;一是生態(tài)環(huán)境監(jiān)測,在生態(tài)環(huán)境監(jiān)測中,不同的生態(tài)類型有不同的生態(tài)要素,并制定了嚴(yán)格的生態(tài)要素數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范,具有法律效力,禁止更改。監(jiān)測數(shù)據(jù)真實反應(yīng)監(jiān)測時點的環(huán)境指標(biāo)情況,在生態(tài)治理工作中,通過歷史監(jiān)測數(shù)據(jù)能了解生態(tài)環(huán)境過去的情況,但在生態(tài)環(huán)境保護(hù)工作的工作規(guī)劃和決策時,往往需要根據(jù)未來規(guī)劃的目標(biāo)來制定當(dāng)前的工作規(guī)劃和決策,使得決策科學(xué)合理又不浪費投資。
2、當(dāng)前水生態(tài)環(huán)境監(jiān)測主要依賴于定期采樣和實驗室分析,這種方法成本高、耗時長,且無法實時反映環(huán)境變化。此外,傳統(tǒng)的預(yù)測模型通常基于固定數(shù)據(jù)集,難以適應(yīng)環(huán)境數(shù)據(jù)的動態(tài)變化。
3、因此,研究一種基于自適應(yīng)模型和動態(tài)數(shù)據(jù)融合的水生態(tài)環(huán)境監(jiān)測數(shù)據(jù)預(yù)測方法在水生態(tài)環(huán)境保護(hù)的工作決策中具有重要的實際應(yīng)用價值。
技術(shù)實現(xiàn)思路
1、為解決現(xiàn)有技術(shù)中存在的問題,本發(fā)明的目的是提供一種基于自適應(yīng)模型和動態(tài)數(shù)據(jù)融合的水生態(tài)環(huán)境監(jiān)測數(shù)據(jù)預(yù)測方法,本發(fā)明通過自適應(yīng)模型和動態(tài)數(shù)據(jù)融合技術(shù),實現(xiàn)對水生態(tài)環(huán)境監(jiān)測數(shù)據(jù)的實時和準(zhǔn)確預(yù)測;模型能夠根據(jù)實時數(shù)據(jù)動態(tài)調(diào)整參數(shù),提高預(yù)測的準(zhǔn)確性和響應(yīng)速度。
2、為實現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案是:一種基于自適應(yīng)模型和動態(tài)數(shù)據(jù)融合的水生態(tài)環(huán)境監(jiān)測數(shù)據(jù)預(yù)測方法,包括以下步驟:
3、步驟1、確定需要預(yù)測的生態(tài)環(huán)境要素;
4、步驟2、從監(jiān)測數(shù)據(jù)庫中獲取歷史數(shù)據(jù)并加載到預(yù)測訓(xùn)練環(huán)境;
5、步驟3、對歷史數(shù)據(jù)進(jìn)行預(yù)處理;
6、步驟4、模型構(gòu)建,對數(shù)據(jù)進(jìn)行基礎(chǔ)特征識別、關(guān)鍵參數(shù)提取,根據(jù)數(shù)據(jù)基礎(chǔ)特征、通過模型初選機(jī)制從已完成訓(xùn)練的數(shù)據(jù)模型庫篩選并確定最佳數(shù)據(jù)模型;
7、步驟5、對模型進(jìn)行訓(xùn)練,使用歷史數(shù)據(jù)集進(jìn)行迭代訓(xùn)練,并優(yōu)化模型參數(shù);
8、步驟6、設(shè)定預(yù)測條件,運行預(yù)測模型,輸出預(yù)測結(jié)果,并提供精度評價。
9、作為本發(fā)明的進(jìn)一步改進(jìn),在步驟1中,所述生態(tài)環(huán)境要素包括水質(zhì)指標(biāo)和生物多樣性指數(shù),且由工作目標(biāo)決定對生態(tài)環(huán)境全要素中的哪個要素進(jìn)行預(yù)測。
10、作為本發(fā)明的進(jìn)一步改進(jìn),在步驟2中,所述歷史數(shù)據(jù)以時間序列的形式存在,表示如下:
11、d={d1,d2,...,dn}
12、其中d是歷史數(shù)據(jù)集,di是在時間點i觀測到的數(shù)據(jù)。
13、作為本發(fā)明的進(jìn)一步改進(jìn),在步驟3中,預(yù)處理包括數(shù)據(jù)清洗、異常值處理、數(shù)據(jù)歸一化:
14、
15、其中x是原始數(shù)據(jù),x'是歸一化后的數(shù)據(jù)。
16、作為本發(fā)明的進(jìn)一步改進(jìn),所述步驟4具體如下:
17、將多因素的歷史監(jiān)測數(shù)據(jù)中可能相關(guān)的因素變量轉(zhuǎn)換成一組線性不相關(guān)的因素變量,形成模型潛在參數(shù),即潛參集合;
18、對模型潛參進(jìn)行表達(dá)尺度標(biāo)準(zhǔn)化,構(gòu)建統(tǒng)一的模型參數(shù)表達(dá)基準(zhǔn):
19、
20、其中,x'i是標(biāo)準(zhǔn)化后的數(shù)據(jù),xi是原始數(shù)據(jù),μi是數(shù)據(jù)的均值,σi是數(shù)據(jù)的標(biāo)準(zhǔn)差;
21、計算標(biāo)準(zhǔn)化后模型潛參的數(shù)學(xué)特征分布,即潛參對模型最終特征表達(dá)的貢獻(xiàn)度矩陣c:
22、
23、其中,cij是協(xié)方差矩陣的元素,x'ki是第k個樣本在第i個特征上的值,是第i個特征的均值,,x'kj是第k個樣本在第j個特征上的值,是第j個特征的均值;
24、貢獻(xiàn)度矩陣分解,得出每個潛參在模型特征表達(dá)中的量化計算式:
25、cv=λv
26、其中cv是潛參v的模型特征貢獻(xiàn)度,λ是潛參特征征,v是潛參特征向量;
27、選擇特征貢獻(xiàn)主成分,對所有潛參特征貢獻(xiàn)度排序,選擇前n個貢獻(xiàn)度,構(gòu)建潛參特征貢獻(xiàn)度矩陣vn:
28、vn=[v1?v2?…?vn]。
29、作為本發(fā)明的進(jìn)一步改進(jìn),在步驟5中,把初選模型后的監(jiān)測數(shù)據(jù)動態(tài)追加到的按一定機(jī)制劃分時段的歷史數(shù)據(jù),構(gòu)建不同的數(shù)據(jù)訓(xùn)練與測試集,對模型進(jìn)行迭代訓(xùn)練,并對訓(xùn)練結(jié)果進(jìn)行精度評價和超參調(diào)優(yōu),直到模型精度達(dá)到業(yè)務(wù)要求,模型完成優(yōu)化升級并進(jìn)入模型庫;訓(xùn)練集與測試集劃分采用k折交叉驗證機(jī)制,以提供比單次劃分訓(xùn)練集和測試集更穩(wěn)健的模型性能估計;具體包括以下步驟:
30、步驟5.1、將數(shù)據(jù)集d隨機(jī)分成k個大小相等的子集d∈{d1?d2?…?dk},對于每個子集di,重組數(shù)據(jù)集{di,dtrain};其中di為測試集,dtrain=d-di為訓(xùn)練集;
31、步驟5.2、在測試集di上使用在初選模型m進(jìn)行預(yù)測,得到預(yù)測值具體包括:
32、精度評估,計算精度指標(biāo)ei:
33、
34、其中,yij是第i折測試集中第j個樣本的真實值,是預(yù)測值,ni是測試集di中樣本的數(shù)量;
35、計算k折平均精度ecv:
36、
37、其中k為k折的數(shù)量,ni為第i折的樣本數(shù)量;
38、計算n個迭代,計算k折平均精度集:
39、
40、精確率評估,計算精確率pi:
41、
42、其中pi是第i折測試集精確率,n是參與訓(xùn)練的樣本總數(shù),是第k折測試集dk中樣本的數(shù)量,yj是第j個樣本的真實值,是第j個樣本預(yù)測值,ε是模型預(yù)測精度要求;
43、計算k折平均精確率pcv:
44、
45、計算n個迭代,計算k折平均精確率集:
46、
47、步驟5.3、尋找最優(yōu)模型參數(shù):對平均精度和均精確率分別進(jìn)行線形回歸擬合,得到平均精度和平均精確率的特征方程:
48、
49、其中是平均精度,
50、其中是平均精確率,x是模型訓(xùn)練迭代次數(shù),兩個特征方程交點即為訓(xùn)練替代次數(shù)的最優(yōu)解:
51、
52、其中x是模型訓(xùn)練迭代次數(shù)。
53、作為本發(fā)明的進(jìn)一步改進(jìn),在步驟6中,預(yù)測條件涉及時間序列的劃分,使用滑動窗口獲?。?/p>
54、xt={xt-k+1,xt-k+2,…,xt}
55、預(yù)測模型按設(shè)定的預(yù)測條件進(jìn)行計算,輸出預(yù)測結(jié)果并給出相應(yīng)的精度評價,即置信度;
56、
57、其中是下一個時間點的預(yù)測值,m是模型函數(shù),θ是模型參數(shù)。
58、作為本發(fā)明的進(jìn)一步改進(jìn),還包括以下步驟:
59、步驟7、記錄預(yù)測過程的日志,包括模型選擇、參數(shù)調(diào)整、預(yù)測結(jié)果。
60、作為本發(fā)明的進(jìn)一步改進(jìn),預(yù)測日志通常記錄模型的運行狀態(tài)和性能指標(biāo),包括:
61、
62、其中t是時間點,是預(yù)測值,yt是實際值,et是誤差,θt是在時間點t的模型參數(shù)。
63、本發(fā)明在水生態(tài)環(huán)境監(jiān)測數(shù)據(jù)分析領(lǐng)域引入大數(shù)據(jù)和機(jī)器學(xué)習(xí)的技術(shù),并在其基礎(chǔ)上針對水生態(tài)環(huán)境監(jiān)測數(shù)據(jù)分析預(yù)測提出根據(jù)監(jiān)測數(shù)據(jù)特征自適應(yīng)數(shù)據(jù)模型技術(shù)和引入后續(xù)監(jiān)測數(shù)據(jù)動態(tài)融合到訓(xùn)練數(shù)據(jù)集和測試集進(jìn)行模型迭代訓(xùn)練時實現(xiàn)參數(shù)自主進(jìn)化,改進(jìn)傳統(tǒng)機(jī)器學(xué)習(xí)的數(shù)據(jù)模型數(shù)據(jù)集固定帶來的模型訓(xùn)練中數(shù)據(jù)集因素引入的系統(tǒng)性缺陷,本發(fā)明方法具有根據(jù)數(shù)據(jù)特征自適應(yīng)預(yù)測模型和模型自主進(jìn)化、自動優(yōu)化的優(yōu)點,在水生態(tài)環(huán)境數(shù)據(jù)分析技術(shù)領(lǐng)域具有極高的應(yīng)用價值。
64、本發(fā)明的有益效果是:
65、1、本發(fā)明能夠提供更快速、更準(zhǔn)確的水生態(tài)環(huán)境監(jiān)測數(shù)據(jù)預(yù)測,降低監(jiān)測成本,提高決策效率。
66、2、通過自適應(yīng)和動態(tài)數(shù)據(jù)融合技術(shù),模型能夠更好地適應(yīng)環(huán)境數(shù)據(jù)的動態(tài)變化,提高預(yù)測的可靠性。