日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

基于深度強(qiáng)化學(xué)習(xí)的層級(jí)式船舶軌跡預(yù)測(cè)方法、裝置及產(chǎn)品

文檔序號(hào):39717018發(fā)布日期:2024-10-22 13:03閱讀:來(lái)源:國(guó)知局

技術(shù)特征:

1.一種基于深度強(qiáng)化學(xué)習(xí)的層級(jí)式船舶軌跡預(yù)測(cè)方法,其特征在于,所述方法包括:

2.根據(jù)權(quán)利要求1所述的基于深度強(qiáng)化學(xué)習(xí)的層級(jí)式船舶軌跡預(yù)測(cè)方法,其特征在于,所述基于所述第i個(gè)海上任務(wù)的樣本海上態(tài)勢(shì)信息,進(jìn)行第一階段的深度強(qiáng)化學(xué)習(xí),包括:

3.根據(jù)權(quán)利要求2所述的基于深度強(qiáng)化學(xué)習(xí)的層級(jí)式船舶軌跡預(yù)測(cè)方法,其特征在于,所述編碼器通過(guò)以下步驟訓(xùn)練得到:

4.根據(jù)權(quán)利要求1至3任一所述的基于深度強(qiáng)化學(xué)習(xí)的層級(jí)式船舶軌跡預(yù)測(cè)方法,其特征在于,所述海上任務(wù)集合中的第i個(gè)海上任務(wù)為處于上層任務(wù)層中的任一上層任務(wù);

5.根據(jù)權(quán)利要求1至3任一所述的基于深度強(qiáng)化學(xué)習(xí)的層級(jí)式船舶軌跡預(yù)測(cè)方法,其特征在于,所述博弈任務(wù)網(wǎng)絡(luò)通過(guò)以下步驟訓(xùn)練得到:

6.根據(jù)權(quán)利要求1至3任一所述的基于深度強(qiáng)化學(xué)習(xí)的層級(jí)式船舶軌跡預(yù)測(cè)方法,其特征在于,所述基本評(píng)價(jià)網(wǎng)絡(luò)通過(guò)以下步驟訓(xùn)練得到:

7.根據(jù)權(quán)利要求1至3任一所述的基于深度強(qiáng)化學(xué)習(xí)的層級(jí)式船舶軌跡預(yù)測(cè)方法,其特征在于,所述元評(píng)價(jià)網(wǎng)絡(luò)通過(guò)以下步驟訓(xùn)練得到:

8.一種基于深度強(qiáng)化學(xué)習(xí)的層級(jí)式船舶軌跡預(yù)測(cè)裝置,其特征在于,所述裝置包括:

9.一種電子設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一所述的基于深度強(qiáng)化學(xué)習(xí)的層級(jí)式船舶軌跡預(yù)測(cè)方法。

10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一所述的基于深度強(qiáng)化學(xué)習(xí)的層級(jí)式船舶軌跡預(yù)測(cè)方法。


技術(shù)總結(jié)
本發(fā)明提供了一種基于深度強(qiáng)化學(xué)習(xí)的層級(jí)式船舶軌跡預(yù)測(cè)方法、裝置及產(chǎn)品,涉及強(qiáng)化學(xué)習(xí)領(lǐng)域。包括:針對(duì)海上任務(wù),N個(gè)智能體以最大化總回報(bào)為目標(biāo),基于樣本海上態(tài)勢(shì)信息進(jìn)行深度強(qiáng)化學(xué)習(xí);將歷史已執(zhí)行的各個(gè)海上任務(wù)的聯(lián)合狀態(tài)、聯(lián)合動(dòng)作和總回報(bào)輸入博弈任務(wù)網(wǎng)絡(luò)得到下一海上任務(wù)的軌跡預(yù)測(cè)信息;將當(dāng)前海上態(tài)勢(shì)信息輸入深度強(qiáng)化學(xué)習(xí)后的N個(gè)智能體,得到當(dāng)前海上任務(wù)的聯(lián)合狀態(tài)和聯(lián)合動(dòng)作并輸入基本評(píng)價(jià)網(wǎng)絡(luò),得到當(dāng)前海上任務(wù)的Q值;將下一海上任務(wù)的軌跡預(yù)測(cè)信息和當(dāng)前海上任務(wù)的Q值輸入元評(píng)價(jià)網(wǎng)絡(luò),得到N個(gè)智能體基于新預(yù)測(cè)軌跡的新的聯(lián)合動(dòng)作,提升策略在不同海上局勢(shì)下的通用性。

技術(shù)研發(fā)人員:陶曉明,段一平,焦函,祖曰然,崔洲涓
受保護(hù)的技術(shù)使用者:清華大學(xué)
技術(shù)研發(fā)日:
技術(shù)公布日:2024/10/21
當(dāng)前第2頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1