日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

一種基于多尺度特征融合的隱藏物體檢測算法

文檔序號:39726463發(fā)布日期:2024-10-22 13:26閱讀:2來源:國知局
一種基于多尺度特征融合的隱藏物體檢測算法

本發(fā)明涉及計算機視覺,具體涉及一種基于多尺度特征融合的隱藏物體檢測算法。


背景技術(shù):

1、目標(biāo)檢測是計算機視覺領(lǐng)域的核心問題之一,其任務(wù)是找出圖像或視頻中所有感興趣的目標(biāo),并確定它們的類別和位置。具體來說,目標(biāo)檢測要在圖像中用邊界框標(biāo)定出多個目標(biāo)的位置和類別。在早期,目標(biāo)檢測主要基于傳統(tǒng)的計算機視覺方法,如使用haar特征、hog特征和sift特征等進行特征提取。然而,這些方法往往存在識別準(zhǔn)確率不高、對光照和視角變化敏感等問題。隨著深度學(xué)習(xí)的快速發(fā)展,基于深度學(xué)習(xí)的目標(biāo)檢測技術(shù)取得了顯著突破。卷積神經(jīng)網(wǎng)絡(luò)(cnn)的廣泛應(yīng)用對目標(biāo)檢測技術(shù)的發(fā)展起到了至關(guān)重要的作用。從2014年開始,區(qū)域卷積神經(jīng)網(wǎng)絡(luò)(r-cnn)模型的提出,標(biāo)志著目標(biāo)檢測研究進入了一個新的階段,隨后fast?r-cnn、faster?r-cnn、yolo和ssd等一系列經(jīng)典的目標(biāo)檢測模型相繼涌現(xiàn),這些算法在準(zhǔn)確性和速度上都有所提升,為目標(biāo)檢測提供了強大的工具。

2、隱藏物體檢測是在特定場景下,對被遮擋或不易直接觀察到的物體進行識別和定位的技術(shù)。這種技術(shù)在安全檢查、搜索救援、軍事偵察等領(lǐng)域具有廣泛應(yīng)用需求。由于光照低、遮擋、尺寸小、與背景相似度高等因素,與傳統(tǒng)的目標(biāo)檢測相比隱藏物體檢測被認(rèn)為是一項非常具有挑戰(zhàn)性的任務(wù)。

3、目前,對于隱藏物體檢測的算法有:cpd、egnet、ucnet、sinet等,這些算法開創(chuàng)了隱藏物體檢測的先河,并且在隱藏物體檢測領(lǐng)域做出了極大的貢獻。但是,這些算法對于隱藏物體檢測任務(wù)來說,所能達到的精度還可以提高,模型的復(fù)雜度還可以簡化。并且由于硬件資源的限制,之前的方法不得不將輸入圖像的尺寸調(diào)整為相對較小的尺寸進行網(wǎng)絡(luò)訓(xùn)練。這樣做會導(dǎo)致空間信息的丟失,從而降低了模型的性能。此外,調(diào)整尺寸的操作還會引入鋸齒效應(yīng)或混疊效應(yīng),尤其是在使用較大的縮放因子進行調(diào)整時。這些問題會影響模型對細(xì)節(jié)的準(zhǔn)確檢測能力。同時之前的方法在檢測空間細(xì)節(jié)方面存在一定的局限性。所以對于這些算法來說還是具有可以改進提升的地方。


技術(shù)實現(xiàn)思路

1、本發(fā)明要解決的技術(shù)問題是提供一種基于多尺度特征融合的隱藏物體檢測算法,改進了現(xiàn)有技術(shù)中存在的不足。

2、本發(fā)明采用的技術(shù)方案是:一種基于多尺度特征融合的隱藏物體檢測算法,包括步驟如下:

3、步驟一:將待檢測的圖片輸入到骨干網(wǎng)絡(luò)中來進行特征提取,以獲得多個特征圖;

4、步驟二:該步驟分為兩部分且同時進行,一步是將從骨干網(wǎng)絡(luò)中所提取到的多個特征圖經(jīng)過卷積處理降低通道數(shù)之后全部輸入到解碼器中,經(jīng)過多次上采樣和特征融合來獲得帶有粗略位置信息的圖m;另一步則是將從骨干網(wǎng)絡(luò)中所提取到的部分特征圖輸入到細(xì)節(jié)增強模塊中,經(jīng)過卷積操作和注意力機制從而獲得新的特征圖c3-c5;

5、步驟三:將步驟二中所獲得的粗略圖m和新的特征圖c3-c5輸入到動態(tài)權(quán)重反注意力網(wǎng)絡(luò)組中,以此來獲得更多的圖像細(xì)節(jié)并且最終生成預(yù)測圖。

6、優(yōu)選地,所述的骨干網(wǎng)絡(luò)為res2net-50。

7、具體地,所述步驟二中獲得粗略圖m的方式具體為:

8、步驟2.1:將從骨干網(wǎng)絡(luò)所提取到的特征圖經(jīng)過卷積處理降低通道數(shù)之后的特征圖f1'-f5'對應(yīng)的輸入到解碼器模塊中為x1-x5;

9、步驟2.2:對x1-x5分別進行特征的逐級上采樣和與更大尺度的特征相乘,實現(xiàn)特征的融合,以此來得到細(xì)化特征圖f1msf-f5msf;

10、步驟2.3:接著將f1msf-f5msf都送入解碼器中最終獲得粗略圖m。

11、具體地,所述步驟二中獲得新的特征圖c3-c5的方式具體為:

12、步驟2.4:將由骨干網(wǎng)絡(luò)中所提取到的特征圖f5,輸入到細(xì)節(jié)增強模塊中經(jīng)過卷積處理和注意力機制,獲得的新的特征圖c5;

13、步驟2.5:同步驟2.4,獲得的新的特征圖c4,c3。

14、具體地,所述步驟三中獲得預(yù)測圖的方式具體為:

15、步驟3.1:將由步驟二中所獲得的c5和粗略圖m輸入到動態(tài)權(quán)重反注意力網(wǎng)絡(luò)組中,之后將c5和粗略圖m輸入到動態(tài)權(quán)重反注意力網(wǎng)絡(luò)組之后所得的結(jié)果與步驟二中所獲得的粗略圖m相加,最終獲得預(yù)測圖preds?5;

16、步驟3.2:將由步驟二中所獲得的c4和步驟3.1中所獲得的preds_5輸入到動態(tài)權(quán)重反注意力網(wǎng)絡(luò)組中,之后將c4和preds_5輸入到動態(tài)權(quán)重反注意力網(wǎng)絡(luò)組之后所得的結(jié)果與步驟3.1中所獲得的preds_5經(jīng)過上采樣之后相加,最終獲得預(yù)測圖preds_4;

17、步驟3.3:將由步驟二中所獲得的c3和步驟3.2中所獲得的preds_4輸入到動態(tài)權(quán)重反注意力網(wǎng)絡(luò)組中,之后將c3和preds_4輸入到動態(tài)權(quán)重反注意力網(wǎng)絡(luò)組之后所得的結(jié)果與步驟3.2中所獲得的preds_4經(jīng)過上采樣之后相加,最后獲得預(yù)測圖preds_3;

18、步驟3.4:將步驟3.3中所得到的preds_3經(jīng)過sigmoid非線性函數(shù)激活之后獲得最終預(yù)測圖res。

19、具體地,解碼器設(shè)計了兩種不同的特征融合策略,一種是逐級的上采樣和相乘,另一種是上采樣、拼接、卷積處理和批量歸一化操作,同時在細(xì)節(jié)增強模塊中所使用的多分支結(jié)構(gòu)捕獲了不同尺度的上下文信息,還通過注意力機制使得模型能夠更加聚焦于輸入特征圖中的重要部分,最后在反注意力網(wǎng)絡(luò)組中所加入的動態(tài)權(quán)重方法用以強調(diào)或抑制不同的特征。

20、本發(fā)明的有益效果是:本發(fā)明算法通過學(xué)習(xí)多尺度特征,能夠更好地捕捉目標(biāo)物體的上下文信息,提高檢測的準(zhǔn)確性。并且該算法可以根據(jù)需要調(diào)整輸入圖像的尺寸,從而能夠在不同場景下實現(xiàn)更好的檢測效果。此外,該算法在保持模型性能的同時,考慮了硬件資源的限制,減小了模型復(fù)雜度的同時保證了模型的有效性,以提高檢測的準(zhǔn)確性和實際可行性。



技術(shù)特征:

1.一種基于多尺度特征融合的隱藏物體檢測算法,其特征在于,包括步驟如下:

2.根據(jù)權(quán)利要求1所述的一種基于多尺度特征融合的隱藏物體檢測算法,其特征在于,所述的骨干網(wǎng)絡(luò)為res2net-50。

3.根據(jù)權(quán)利要求1所述的一種基于多尺度特征融合的隱藏物體檢測算法,其特征在于,所述步驟二中獲得粗略圖m的方式具體為:

4.根據(jù)權(quán)利要求1所述的一種基于多尺度特征融合的隱藏物體檢測算法,其特征在于,所述步驟二中獲得新的特征圖c3-c5的方式具體為:

5.根據(jù)權(quán)利要求4所述的一種基于多尺度特征融合的隱藏物體檢測算法,其特征在于,所述步驟三中獲得預(yù)測圖的方式具體為:

6.根據(jù)權(quán)利要求1所述的一種基于多尺度特征融合的隱藏物體檢測算法,其特征在于:解碼器設(shè)計了兩種不同的特征融合策略,一種是逐級的上采樣和相乘,另一種是上采樣、拼接、卷積處理和批量歸一化操作,同時在細(xì)節(jié)增強模塊中所使用的多分支結(jié)構(gòu)捕獲了不同尺度的上下文信息,還通過注意力機制使得模型能夠更加聚焦于輸入特征圖中的重要部分,最后在反注意力網(wǎng)絡(luò)組中所加入的動態(tài)權(quán)重方法用以強調(diào)或抑制不同的特征。


技術(shù)總結(jié)
本發(fā)明涉及一種基于多尺度特征融合的隱藏物體檢測算法,屬于計算機視覺技術(shù)領(lǐng)域。首先使用骨干網(wǎng)絡(luò)來提取輸入圖片的特征;然后所獲得的特征同時進入兩個分支,一個分支為所有特征圖經(jīng)過卷積處理降低通道數(shù)之后都輸入到解碼器中生成粗略圖,另一分支為一部分特征圖輸入到感受野模塊中來加強圖像紋理;最后使用解碼器生成的粗略圖與通過感受野模塊的特征圖相加并且經(jīng)過一個動態(tài)權(quán)重反注意力網(wǎng)絡(luò)組來生成最終的預(yù)測圖。本發(fā)明在感受野模塊中加入了一種注意力機制來提高模型的感知能力,從而在不增加網(wǎng)絡(luò)復(fù)雜性的情況下改善性能。并且在反注意力網(wǎng)絡(luò)組中所使用的動態(tài)權(quán)重的方法可以起到強調(diào)或抑制不同特征的作用。

技術(shù)研發(fā)人員:李文國,王松,楊添博,宋倫偉,王文笑
受保護的技術(shù)使用者:昆明理工大學(xué)
技術(shù)研發(fā)日:
技術(shù)公布日:2024/10/21
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1