本發(fā)明涉及灘涂泥沙分析,具體是一種灘涂泥沙組分預(yù)測方法及系統(tǒng)。
背景技術(shù):
1、潮灘不斷演變是灘涂的典型特征之一,對泥沙組分的分析能夠更好地處理灘涂演變問題,對灘涂的未來變化的研究及灘涂的進(jìn)一步保護(hù)具有重要作用。目前,針對泥沙組分分析,現(xiàn)有研究方法多集中于常規(guī)回歸模型,而對于通過人工智能機(jī)器學(xué)習(xí)對泥沙組分的估算研究卻少有涉及。
2、為了更好地了解潮灘演變規(guī)律,為灘涂的保護(hù)提供科學(xué)依據(jù),需要精確預(yù)測泥沙含量的組分變化。目前,借助衛(wèi)星遙感技術(shù)可以獲取光的不同波段信息,利用arcgis和空間模型,可以對光的波段數(shù)據(jù)進(jìn)行空間整合分析,但主要存在難點(diǎn):潮灘泥沙組分在小范圍內(nèi)都有較大變化,且其與光波段數(shù)據(jù)的關(guān)系并非完全線性,傳統(tǒng)的預(yù)測模型多為多元線性回歸模型,面對非線性問題時處理較為困難。
3、機(jī)器學(xué)習(xí)算法是一種利用數(shù)據(jù),自動進(jìn)行建模分析以及利用模型進(jìn)一步預(yù)測的數(shù)據(jù)分析方法,是對非線性系統(tǒng)進(jìn)行回歸分析的有效方式,通過機(jī)器學(xué)習(xí)方法進(jìn)行研究可以有效地克服多因素復(fù)雜關(guān)系的建立難題。將機(jī)器學(xué)習(xí)算法應(yīng)用到泥沙組分的預(yù)測中,可以有效的提高精度。
4、綜上,為了能夠準(zhǔn)確的掌握灘涂泥沙組分特性,有必要提出一種灘涂泥沙不同組分占比的估算方法,進(jìn)一步為灘涂的科學(xué)保護(hù)提供有力的技術(shù)支撐。
技術(shù)實現(xiàn)思路
1、為了解決上述問題,本發(fā)明提出了一種使用遙感手段,獲取灘涂的不同光波段特征,并利用機(jī)器學(xué)習(xí)算法模型實現(xiàn)灘涂泥沙不同組分的準(zhǔn)確估算。
2、為了達(dá)到上述目的,本發(fā)明是通過以下技術(shù)方案來實現(xiàn)的:
3、本發(fā)明的一種灘涂泥沙組分預(yù)測方法,包括如下操作:
4、對待測區(qū)域進(jìn)行實地采樣獲得采樣樣本,根據(jù)采樣樣本測算出待測區(qū)域的泥沙組分?jǐn)?shù)據(jù);
5、對所測算出的泥沙組分?jǐn)?shù)據(jù)進(jìn)行線性均衡處理,獲得第一預(yù)處理數(shù)據(jù);
6、收集灘涂泥沙的衛(wèi)星遙感數(shù)據(jù)并對衛(wèi)星遙感數(shù)據(jù)進(jìn)行預(yù)處理,得到第二預(yù)處理數(shù)據(jù),第二預(yù)處理數(shù)據(jù)包括不同光波段的信息數(shù)據(jù);
7、對第一預(yù)處理數(shù)據(jù)和第二預(yù)處理數(shù)據(jù)進(jìn)行分割,得到訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集;
8、將訓(xùn)練數(shù)據(jù)集中的數(shù)據(jù)代入到多個機(jī)器學(xué)習(xí)算法模型中,在多個機(jī)器學(xué)習(xí)算法模型中以不同波段的信息數(shù)據(jù)作為輸入變量,將粘土pc’、粉砂psi’、砂psa’作為輸出變量,建立根據(jù)光不同波段對泥沙組分的估算模型,表達(dá)式為:
9、pc’=f(b1,b2,,bn);
10、psi’=f(b1,b2,,bn);
11、psa’=f(b1,b2,,bn);
12、其中,f()為回歸函數(shù),b1,b2,,bn為不同波段的信息數(shù)據(jù),n為不同波段的數(shù)量;
13、利用測試集中的數(shù)據(jù)驗證訓(xùn)練好的多個機(jī)器學(xué)習(xí)算法模型的擬合程度,根據(jù)擬合程度,對比不同機(jī)器學(xué)習(xí)算法模型反演結(jié)果的誤差,篩選訓(xùn)練后誤差最小、精度最高的機(jī)器學(xué)習(xí)算法模型,利用篩選出的機(jī)器學(xué)習(xí)算法模型計算灘涂泥沙組分。
14、本發(fā)明的進(jìn)一步改進(jìn)在于:對待測區(qū)域進(jìn)行實地采樣獲得采樣樣本,根據(jù)采樣樣本測算出待測區(qū)域的泥沙組分?jǐn)?shù)據(jù),具體包括:
15、對待測區(qū)域進(jìn)行多樣點(diǎn)的采樣,每一樣點(diǎn)范圍包括多個采樣點(diǎn),獲得多個采樣樣品;
16、對采樣樣品進(jìn)行泥沙顆粒分析并記錄,獲得各個采樣點(diǎn)的泥沙組分?jǐn)?shù)據(jù),包含粘土pc、粉砂psi、砂psa。
17、本發(fā)明的進(jìn)一步改進(jìn)在于:收集灘涂泥沙的衛(wèi)星遙感數(shù)據(jù)并對衛(wèi)星遙感數(shù)據(jù)進(jìn)行預(yù)處理,得到第二預(yù)處理數(shù)據(jù),具體包括:
18、獲取灘涂泥沙的衛(wèi)星遙感數(shù)據(jù);
19、利用envi軟件對所收集的衛(wèi)星遙感數(shù)據(jù)進(jìn)行區(qū)域分割,按土地類型選取與待測區(qū)域?qū)?yīng)的存在淹沒頻率的光灘,形成遙感圖;
20、利用arcgis軟件中的重采樣功能,采用疊加采樣的方式,即先使用最臨近插值法,后使用雙線性插值法,對遙感圖進(jìn)行重采樣,利用掩膜提取功能對遙感圖進(jìn)行特征提取,并將提取出的特征進(jìn)行矢量化處理,生成矢量圖;
21、利用arcgis軟件對矢量圖進(jìn)行多值提取到點(diǎn)得到第二預(yù)處理數(shù)據(jù)。
22、本發(fā)明的進(jìn)一步改進(jìn)在于:機(jī)器學(xué)習(xí)算法模型包括svr支持向量回歸、隨機(jī)森林rf、邏輯回歸lr。
23、本發(fā)明的進(jìn)一步改進(jìn)在于:估算模型為:
24、pc’=f(b1,b2,b3,b4,b5,b6,b7);
25、psi’=f(b1,b2,b3,b4,b5,b6,b7);
26、psa’=f(b1,b2,b3,b4,b5,b6,b7);
27、其中,b1為海岸波段、b2為藍(lán)波段、b3為綠波、b4為紅波、b5為近紅外波段、b6為短波紅外1、b7為短波紅外2。
28、本發(fā)明的進(jìn)一步改進(jìn)在于:利用測試集中的數(shù)據(jù)驗證訓(xùn)練好的多個機(jī)器學(xué)習(xí)算法模型的擬合程度,根據(jù)擬合程度,對比不同機(jī)器學(xué)習(xí)算法模型反演結(jié)果的誤差,篩選訓(xùn)練后誤差最小、精度最高的機(jī)器學(xué)習(xí)算法模型,具體包括:
29、將測試數(shù)據(jù)集的數(shù)據(jù)代入到訓(xùn)練好的多個機(jī)器學(xué)習(xí)算法模型中,獲得對應(yīng)機(jī)器學(xué)習(xí)算法模型的預(yù)測結(jié)果,包括粘土pc、粉砂psi、砂psa含量百分比;
30、驗證多個機(jī)器學(xué)習(xí)算法模型的擬合程度,具體包括:
31、利用決定系數(shù)、均方根誤差與平均絕對誤差作為評估指標(biāo),對不同的機(jī)器學(xué)習(xí)算法模型的預(yù)測結(jié)果進(jìn)行對比,選取最優(yōu)的機(jī)器學(xué)習(xí)算法模型。
32、本發(fā)明的灘涂泥沙組分預(yù)測系統(tǒng),系統(tǒng)包括:
33、采樣模塊,用于對待測區(qū)域進(jìn)行實地采樣獲得采樣樣本,根據(jù)采樣樣本測算出待測區(qū)域的泥沙組分?jǐn)?shù)據(jù);
34、第一預(yù)處理模塊,用于對所測算出的泥沙組分?jǐn)?shù)據(jù)進(jìn)行線性均衡處理,獲得第一預(yù)處理數(shù)據(jù);
35、第二預(yù)處理模塊,用于收集灘涂泥沙的衛(wèi)星遙感數(shù)據(jù)并對衛(wèi)星遙感數(shù)據(jù)進(jìn)行預(yù)處理,得到第二預(yù)處理數(shù)據(jù),第二預(yù)處理數(shù)據(jù)包括不同光波段的信息數(shù)據(jù);
36、分割模塊,用于對第一預(yù)處理數(shù)據(jù)和第二預(yù)處理數(shù)據(jù)進(jìn)行分割,得到訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集;
37、模型建立模塊,用于利用多個機(jī)器學(xué)習(xí)算法建立多個根據(jù)光不同波段對泥沙組分的估算模型,包括在在多個機(jī)器學(xué)習(xí)算法模型中以不同波段的信息數(shù)據(jù)作為輸入變量,將粘土pc’、粉砂psi’、砂psa’作為輸出變量,建立根據(jù)光不同波段對泥沙組分的估算模型,表達(dá)式為:
38、pc’=f(b1,b2,,bn);
39、psi’=f(b1,b2,,bn);
40、psa’=f(b1,b2,,bn);
41、其中,f()為回歸函數(shù),b1,b2,,bn為不同波段的信息數(shù)據(jù),n為不同波段的數(shù)量;
42、模型驗證模塊,用于利用測試集中的數(shù)據(jù)驗證訓(xùn)練好的多個機(jī)器學(xué)習(xí)算法模型的擬合程度,根據(jù)擬合程度篩選出最優(yōu)算法模型;
43、預(yù)測模塊,用于篩選出最優(yōu)算法模型,并利用最優(yōu)算法模型計算灘涂泥沙組分。
44、本發(fā)明的進(jìn)一步改進(jìn)在于:采樣模塊進(jìn)行的具體操作包括:
45、對待測區(qū)域進(jìn)行多樣點(diǎn)的采樣,每一樣點(diǎn)范圍包括多個采樣點(diǎn),獲得多個采樣樣品;
46、對采樣樣品進(jìn)行泥沙顆粒分析并記錄,獲得各個采樣點(diǎn)的泥沙組分?jǐn)?shù)據(jù),包含粘土pc、粉砂psi、砂psa。
47、本發(fā)明的進(jìn)一步改進(jìn)在于:第二預(yù)處理模塊進(jìn)行的具體操作包括:
48、獲取灘涂泥沙的衛(wèi)星遙感數(shù)據(jù);
49、利用envi軟件對所收集的衛(wèi)星遙感數(shù)據(jù)進(jìn)行區(qū)域分割,按土地類型選取與待測區(qū)域?qū)?yīng)的存在淹沒頻率的光灘,形成遙感圖,其中,土地類型包括光灘、鹽沼植被帶等;
50、利用arcgis軟件中的重采樣功能,采用疊加采樣的方式,即先使用最臨近插值法,后使用雙線性插值法,對遙感圖進(jìn)行重采樣,利用掩膜提取功能對遙感圖進(jìn)行特征提取,并將提取出的特征進(jìn)行矢量化處理,生成矢量圖;
51、利用arcgis軟件對矢量圖進(jìn)行多值提取到點(diǎn)得到第二預(yù)處理數(shù)據(jù)。
52、本發(fā)明的進(jìn)一步改進(jìn)在于:模型驗證模塊進(jìn)行的具體操作包括:
53、將測試數(shù)據(jù)集的數(shù)據(jù)代入到訓(xùn)練好的多個機(jī)器學(xué)習(xí)算法模型中,獲得對應(yīng)機(jī)器學(xué)習(xí)算法模型的預(yù)測結(jié)果,包括粘土pc、粉砂psi、砂psa含量百分比;
54、驗證多個機(jī)器學(xué)習(xí)算法模型的擬合程度,具體包括:
55、利用決定系數(shù)、均方根誤差與平均絕對誤差作為評估指標(biāo),對不同的機(jī)器學(xué)習(xí)算法模型的預(yù)測結(jié)果進(jìn)行對比,選取最優(yōu)的機(jī)器學(xué)習(xí)算法模型。
56、本發(fā)明的有益效果是:本發(fā)明使用遙感手段,獲取潮灘的不同光波段特征,并在gis平臺上整合,利用機(jī)器學(xué)習(xí)算法模型,可以實現(xiàn)潮灘泥沙不同組分的準(zhǔn)確估算,消除傳統(tǒng)方式在反演時的基礎(chǔ)數(shù)據(jù)誤差與非線性數(shù)據(jù)問題,從而提高灘涂泥沙組分的模擬精度。