本發(fā)明涉及水庫增蓄的聲波增雨作業(yè)點(diǎn)選址方法、系統(tǒng)、設(shè)備及介質(zhì),屬于聲波增雨作業(yè)。
背景技術(shù):
1、傳統(tǒng)的水庫增蓄是指通過人工手段,如開閘放水、關(guān)閉閘門等,使得水庫中的水位上升,增加水庫的蓄水量,確保水庫在干旱季節(jié)或水資源緊張時期有足夠的儲備水源。而近幾年逐漸涌現(xiàn)通過聲波增雨技術(shù)進(jìn)行水庫增蓄的手段。
2、聲波增雨作業(yè)是一種通過聲波技術(shù)來促進(jìn)云層降水的人工影響天氣的方法。在進(jìn)行聲波增雨作業(yè)時,選址是一個非常重要的環(huán)節(jié)。選址的合理性直接關(guān)系到聲波增雨作業(yè)的效果和安全性。選址要考慮聲波增雨設(shè)備的功率、覆蓋范圍、當(dāng)?shù)氐臍庀髼l件、環(huán)境保護(hù)等因素。
3、現(xiàn)有的設(shè)施選址方案大多針對的是固定的設(shè)施,例如公開號為cn114049031a的中國發(fā)明專利公開了一種雨水調(diào)蓄池優(yōu)化選址的方法,利用構(gòu)建指標(biāo)體系、swmm模型和層次分析法等手段,確定城市中內(nèi)澇風(fēng)險大的節(jié)點(diǎn),以對應(yīng)節(jié)點(diǎn)確定雨水調(diào)蓄池的地址。上述專利中,城市建設(shè)和結(jié)構(gòu)在很長的一段時間內(nèi)并不會發(fā)生變化,但是一旦城市結(jié)構(gòu)發(fā)生變化,內(nèi)澇風(fēng)險大的節(jié)點(diǎn)也會發(fā)生相應(yīng)變化,以往設(shè)置的調(diào)蓄池地址就非最優(yōu)選擇。而水庫增蓄的聲波增雨作業(yè)正是一個需要頻繁調(diào)整的過程,在短期內(nèi)云層和空氣條件都會發(fā)生巨大的改變,聲波增雨作業(yè)的優(yōu)選選址就會跟著改變,因此傳統(tǒng)的設(shè)施選址方案并不適用于聲波增雨作業(yè)選址問題。
4、如何綜合考慮水庫增蓄、氣象條件、生態(tài)環(huán)境等因素,選擇一個合適的位置進(jìn)行作業(yè),以達(dá)到最佳的水庫增蓄效果,是目前急需解決的問題。
技術(shù)實現(xiàn)思路
1、為了解決上述現(xiàn)有技術(shù)中存在的問題,本發(fā)明提出了一種水庫增蓄的聲波增雨作業(yè)點(diǎn)選址方法、系統(tǒng)、設(shè)備及介質(zhì)。
2、本發(fā)明的技術(shù)方案如下:
3、一方面,本發(fā)明提供一種水庫增蓄的聲波增雨作業(yè)點(diǎn)選址方法,包括以下步驟:
4、將水庫增蓄的聲波增雨作業(yè)點(diǎn)選址問題構(gòu)建為多目標(biāo)組合問題;
5、基于多目標(biāo)組合問題的決策空間獲取多目標(biāo)組合問題的基本影響因子;
6、構(gòu)建多目標(biāo)組合問題的目標(biāo)函數(shù),并基于各基本影響因子以及水庫增蓄的歷史聲波作業(yè)數(shù)據(jù),使用多元組將多目標(biāo)組合問題轉(zhuǎn)換為馬爾科夫決策過程;
7、將多目標(biāo)強(qiáng)化學(xué)習(xí)算法應(yīng)用于上述馬爾科夫決策過程,將聲波增雨裝置的控制系統(tǒng)作為智能體,目標(biāo)水庫范圍作為環(huán)境,利用多目標(biāo)強(qiáng)化學(xué)習(xí)算法獲取智能體在不同狀態(tài)下的帕累托前沿,基于帕累托前沿輸出目標(biāo)水庫的聲波作業(yè)點(diǎn)地址。
8、作為優(yōu)選實施方式,所述多目標(biāo)組合問題包括水庫庫容最優(yōu)化、增雨影響最優(yōu)化以及環(huán)境影響最優(yōu)化。
9、作為優(yōu)選實施方式,所述構(gòu)建多目標(biāo)組合問題的目標(biāo)函數(shù)具體包括:
10、水庫庫容最優(yōu)化目標(biāo)函數(shù)、增雨影響最優(yōu)化目標(biāo)函數(shù)以及環(huán)境影響最優(yōu)化目標(biāo)函數(shù);
11、所述水庫庫容最優(yōu)化目標(biāo)函數(shù)具體為:
12、
13、其中,為制定的時段內(nèi)的計劃水庫增蓄水量,為時段內(nèi)在對應(yīng)選址進(jìn)行聲波增雨作業(yè)在水庫區(qū)域的預(yù)計降水量,為時段內(nèi)水庫的自然增蓄水量,為時段內(nèi)水庫的水蒸發(fā)量;
14、所述增雨影響最優(yōu)化目標(biāo)函數(shù)具體為:
15、
16、其中,為時段內(nèi)在對應(yīng)選址進(jìn)行聲波增雨作業(yè)引起的降雨類型預(yù)測變化次數(shù);為第次降雨類型所對應(yīng)的權(quán)值,∈0~1;為第次降雨類型的預(yù)測降雨持續(xù)時長;
17、所述環(huán)境影響最優(yōu)化目標(biāo)函數(shù)具體為:
18、
19、其中,為對應(yīng)選址的地貌系數(shù),對應(yīng)選址的地貌交通越便捷,地貌系數(shù)越?。粸閷?yīng)選址的海拔系數(shù),海拔系數(shù)隨海拔的高度而減?。粸閷?yīng)選址的聲波影響系數(shù),對應(yīng)選址在預(yù)設(shè)范圍內(nèi)的居民戶數(shù)越少,聲波影響系數(shù)越??;為水庫區(qū)域面積,為在對應(yīng)選址進(jìn)行聲波增雨作業(yè)引起的降雨區(qū)域與水庫區(qū)域的重疊面積。
20、作為優(yōu)選實施方式,所述使用多元組將多目標(biāo)組合問題轉(zhuǎn)換為馬爾科夫決策過程的步驟具體為:
21、通過水庫增蓄的歷史聲波作業(yè)數(shù)據(jù),使用多元組構(gòu)建水庫增蓄的聲波增雨作業(yè)點(diǎn)選址的馬爾科夫決策過程;
22、其中,為狀態(tài)空間,,為時刻下從水庫范圍內(nèi)第個地點(diǎn)獲取的狀態(tài)數(shù)據(jù),,其中為時刻下從水庫范圍第個地點(diǎn)獲取的第個基本影響因子的觀測值;為動作空間,時刻智能體的動作,動作對應(yīng)時刻聲波增雨作業(yè)點(diǎn)的移動;為狀態(tài)轉(zhuǎn)移矩陣;為獎勵函數(shù),獎勵函數(shù)具體為多目標(biāo)組合問題的目標(biāo)函數(shù)。
23、作為優(yōu)選實施方式,所述利用多目標(biāo)強(qiáng)化學(xué)習(xí)算法獲取智能體在不同狀態(tài)下的帕累托前沿的步驟具體為:
24、建立如下式所示的尋找最大化獎勵函數(shù):
25、
26、其中,為獎勵函數(shù)所對應(yīng)的多目標(biāo)組合問題的目標(biāo)函數(shù)中的第m個目標(biāo)的累計獎勵;
27、
28、其中,為考慮t時刻狀態(tài)數(shù)據(jù)和動作的累計獎勵計算函數(shù),是根據(jù)t時刻狀態(tài)數(shù)據(jù)和動作的聯(lián)合概率分布,為尋優(yōu)的終止時間,為第m個目標(biāo)的獎勵系數(shù),指示t時刻第m個目標(biāo)的重要性,∈0~1,且,表示第個目標(biāo)的重要性;為根據(jù)t時刻狀態(tài)數(shù)據(jù)和動作計算出的第m個目標(biāo)的獎勵值;
29、初始化多目標(biāo)強(qiáng)化學(xué)習(xí)算法,通過水庫增蓄的歷史聲波作業(yè)數(shù)據(jù)迭代執(zhí)行多目標(biāo)強(qiáng)化學(xué)習(xí)任務(wù),將獲取的帕累托點(diǎn)放入帕累托集中;
30、對帕累托集進(jìn)行標(biāo)準(zhǔn)化處理,并對標(biāo)準(zhǔn)化處理后的帕累托集中的標(biāo)準(zhǔn)化帕累托點(diǎn)進(jìn)行排序處理,得到序列化最優(yōu)點(diǎn)集;
31、在每次迭代時,基于序列化最優(yōu)點(diǎn)集確定下一時刻第m個目標(biāo)的獎勵系數(shù),根據(jù)下一時刻第m個目標(biāo)的獎勵系數(shù)執(zhí)行下一時刻的強(qiáng)化學(xué)習(xí)任務(wù),獲取新的帕累托集,根據(jù)新的帕累托集重構(gòu)帕累托前沿。
32、作為優(yōu)選實施方式,所述對帕累托集進(jìn)行標(biāo)準(zhǔn)化處理,并對標(biāo)準(zhǔn)化處理后的帕累托集中的標(biāo)準(zhǔn)化帕累托點(diǎn)進(jìn)行排序處理,得到序列化最優(yōu)點(diǎn)集;在每次迭代時,基于序列化最優(yōu)點(diǎn)集確定下一時刻第m個目標(biāo)的獎勵系數(shù)的步驟具體為:
33、根據(jù)帕累托集,獲取對應(yīng)每一目標(biāo)的帕累托點(diǎn)中的最小值集合和最大值集合,其中最小值集合為:
34、
35、其中,表示第個目標(biāo)的第個帕累托最優(yōu)點(diǎn);表示第個目標(biāo)的帕累托最優(yōu)點(diǎn)中的最小值;
36、最大值集合為:
37、
38、其中,表示第個目標(biāo)的帕累托最優(yōu)點(diǎn)中的最大值;
39、對帕累托集中的每一帕累托最優(yōu)點(diǎn)進(jìn)行標(biāo)準(zhǔn)化處理:
40、
41、其中,為標(biāo)準(zhǔn)化處理后的帕累托最優(yōu)點(diǎn);
42、對標(biāo)準(zhǔn)化處理后的帕累托最優(yōu)點(diǎn)按目標(biāo)進(jìn)行排序處理,得到各目標(biāo)的序列化最優(yōu)點(diǎn)集:
43、
44、其中,為第m個目標(biāo)的序列化最優(yōu)點(diǎn)集中排序第j的點(diǎn),為排序的總數(shù);
45、根據(jù)各目標(biāo)的序列化最優(yōu)點(diǎn)集,通過以下公式計算下一時刻第m個目標(biāo)的獎勵系數(shù):
46、
47、其中,表示下一時刻第m個目標(biāo)的獎勵系數(shù),表示二范數(shù)。
48、作為優(yōu)選實施方式,所述基本影響因子包括:
49、溫度、濕度、云層覆蓋度、云層回波強(qiáng)度、云底高度、云厚度、地形因子以及氣流影響因子。
50、另一方面,本發(fā)明還提供一種水庫增蓄的聲波增雨作業(yè)點(diǎn)選址系統(tǒng),包括:
51、目標(biāo)構(gòu)建模塊,用于將水庫增蓄的聲波增雨作業(yè)點(diǎn)選址問題構(gòu)建為多目標(biāo)組合問題;
52、影響因子確定摸模塊,基于多目標(biāo)組合問題的決策空間獲取多目標(biāo)組合問題的基本影響因子;
53、馬爾科夫決策模塊,用于構(gòu)建多目標(biāo)組合問題的目標(biāo)函數(shù),并基于各基本影響因子以及水庫增蓄的歷史聲波作業(yè)數(shù)據(jù),使用多元組將多目標(biāo)組合問題轉(zhuǎn)換為馬爾科夫決策過程;
54、選址優(yōu)化模塊,用于將多目標(biāo)強(qiáng)化學(xué)習(xí)算法應(yīng)用于上述馬爾科夫決策過程,將聲波增雨裝置的控制系統(tǒng)作為智能體,目標(biāo)水庫范圍作為環(huán)境,利用多目標(biāo)強(qiáng)化學(xué)習(xí)算法獲取智能體在不同狀態(tài)下的帕累托前沿,基于帕累托前沿輸出目標(biāo)水庫的聲波作業(yè)點(diǎn)地址。
55、再一方面,本發(fā)明還提供一種電子設(shè)備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運(yùn)行的計算機(jī)程序,所述處理器執(zhí)行所述程序時實現(xiàn)如本發(fā)明任一實施例所述的水庫增蓄的聲波增雨作業(yè)點(diǎn)選址方法。
56、再一方面,本發(fā)明還提供一種計算機(jī)可讀存儲介質(zhì),其上存儲有計算機(jī)程序,其特征在于,該程序被處理器執(zhí)行時實現(xiàn)如本發(fā)明任一實施例所述的水庫增蓄的聲波增雨作業(yè)點(diǎn)選址方法。
57、本發(fā)明具有如下有益效果:
58、1、本發(fā)明通過將水庫增蓄的聲波增雨作業(yè)點(diǎn)選址轉(zhuǎn)換為多目標(biāo)組合問題,基于多目標(biāo)組合問題的決策空間歸集影響選址問題的基本影響因子,并構(gòu)建對多目標(biāo)進(jìn)行優(yōu)化的目標(biāo)函數(shù)。再利用馬爾科夫決策過程將多目標(biāo)優(yōu)化問題轉(zhuǎn)換為隨機(jī)動態(tài)過程,利用多目標(biāo)強(qiáng)化學(xué)習(xí)的方法在這個隨機(jī)動態(tài)過程中輸出對應(yīng)于多目標(biāo)優(yōu)化的帕累托前沿,獲得在動態(tài)過程中綜合考慮多個水庫增蓄問題的聲波增雨作業(yè)點(diǎn)選址點(diǎn),實現(xiàn)聲波增雨作業(yè)點(diǎn)選址點(diǎn)的智能化。
59、2、本發(fā)明綜合考慮水庫增蓄的聲波增雨作業(yè)點(diǎn)選址中的庫容優(yōu)化、降雨影響和環(huán)境影響問題,并分別構(gòu)建目標(biāo)函數(shù),使得后續(xù)輸出的帕累托前沿綜合考慮了聲波增雨與計劃增蓄的貼切度,聲波增雨對自然環(huán)境的影響最小,聲波增雨對地理環(huán)境的影響最小。在保證聲波增雨作業(yè)的完成度的同時,降低聲波增雨作業(yè)有可能引起的威脅。
60、3、本發(fā)明通過對帕累托集進(jìn)行標(biāo)準(zhǔn)化處理,將帕累托集轉(zhuǎn)換為尺度一致的對應(yīng)每個目標(biāo)的序列化最優(yōu)點(diǎn)集,根據(jù)每個目標(biāo)的序列化最優(yōu)點(diǎn)集中距離最大的兩個點(diǎn)確定該目標(biāo)在下一次強(qiáng)化學(xué)習(xí)的獎勵系數(shù),通過該獎勵系數(shù)引入每個時刻不同目標(biāo)的重要性,以獲取考慮各個目標(biāo)的最大化累積獎勵,逼近帕累托前沿。