日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

圖像自動(dòng)標(biāo)注方法、系統(tǒng)、電子設(shè)備及存儲(chǔ)介質(zhì)與流程

文檔序號(hào):39716076發(fā)布日期:2024-10-22 13:02閱讀:來(lái)源:國(guó)知局

技術(shù)特征:

1.一種圖像自動(dòng)標(biāo)注方法,其特征在于,包括以下步驟:

2.根據(jù)權(quán)利要求1所述的一種圖像自動(dòng)標(biāo)注方法,其特征在于,所述多模態(tài)大模型包括卷積層、注意力模塊、空間金字塔池化層、特征融合層以及全連接層,所述卷積層用于提取輸入圖像的第一圖像特征,所述注意力模塊用于基于通道注意力機(jī)制和空間注意力機(jī)制對(duì)所述第一圖像特征進(jìn)行特征加強(qiáng)得到第二圖像特征,所述空間金字塔池化層用于對(duì)所述第二圖像特征進(jìn)行不同尺度的池化操作得到多尺度圖像特征,所述特征融合層用于對(duì)所述多尺度圖像特征進(jìn)行特征融合得到多模態(tài)融合特征,所述全連接層用于根據(jù)所述多模態(tài)融合特征輸出對(duì)應(yīng)的圖像標(biāo)注結(jié)果。

3.根據(jù)權(quán)利要求1所述的一種圖像自動(dòng)標(biāo)注方法,其特征在于,所述將所述標(biāo)注數(shù)據(jù)集輸入到所述多模態(tài)大模型,得到訓(xùn)練好的圖像標(biāo)注模型,其具體包括:

4.根據(jù)權(quán)利要求1所述的一種圖像自動(dòng)標(biāo)注方法,其特征在于,所述將所述初始描述語(yǔ)句拆解為多個(gè)最小化問(wèn)句,其具體為:

5.根據(jù)權(quán)利要求1所述的一種圖像自動(dòng)標(biāo)注方法,其特征在于,所述將所述目標(biāo)圖像和所述最小化問(wèn)句輸入到所述圖像標(biāo)注模型,得到各所述最小化問(wèn)句對(duì)應(yīng)的目標(biāo)標(biāo)注結(jié)果,其具體包括:

6.根據(jù)權(quán)利要求5所述的一種圖像自動(dòng)標(biāo)注方法,其特征在于,所述根據(jù)所述目標(biāo)標(biāo)注結(jié)果對(duì)所述最小化問(wèn)句進(jìn)行篩選和內(nèi)容重組,得到所述目標(biāo)圖像的目標(biāo)描述語(yǔ)句,其具體包括:

7.根據(jù)權(quán)利要求1至6中任一項(xiàng)所述的一種圖像自動(dòng)標(biāo)注方法,其特征在于,所述根據(jù)所述目標(biāo)標(biāo)注結(jié)果對(duì)所述最小化問(wèn)句進(jìn)行篩選和內(nèi)容重組之前,還包括:

8.一種圖像自動(dòng)標(biāo)注系統(tǒng),其特征在于,包括:

9.一種電子設(shè)備,其特征在于,所述電子設(shè)備包括存儲(chǔ)器、處理器、存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的程序以及用于實(shí)現(xiàn)所述處理器和所述存儲(chǔ)器之間的連接通信的數(shù)據(jù)總線,所述程序被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7中任一項(xiàng)所述的圖像自動(dòng)標(biāo)注方法的步驟。

10.一種存儲(chǔ)介質(zhì),所述存儲(chǔ)介質(zhì)為計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),用于計(jì)算機(jī)可讀存儲(chǔ),其特征在于,所述存儲(chǔ)介質(zhì)存儲(chǔ)有一個(gè)或者多個(gè)程序,所述一個(gè)或者多個(gè)程序可被一個(gè)或者多個(gè)處理器執(zhí)行,以實(shí)現(xiàn)如權(quán)利要求1至7中任一項(xiàng)所述的圖像自動(dòng)標(biāo)注方法的步驟。


技術(shù)總結(jié)
本發(fā)明公開(kāi)了圖像自動(dòng)標(biāo)注方法、系統(tǒng)、電子設(shè)備及存儲(chǔ)介質(zhì),包括:基于特征融合機(jī)制和注意力機(jī)制構(gòu)建多模態(tài)大模型;獲取預(yù)設(shè)的標(biāo)注數(shù)據(jù)集,將標(biāo)注數(shù)據(jù)集輸入到多模態(tài)大模型,得到訓(xùn)練好的圖像標(biāo)注模型;獲取目標(biāo)圖像和對(duì)應(yīng)的初始描述語(yǔ)句,將初始描述語(yǔ)句拆解為多個(gè)最小化問(wèn)句,并將目標(biāo)圖像和最小化問(wèn)句輸入到圖像標(biāo)注模型,得到各最小化問(wèn)句對(duì)應(yīng)的目標(biāo)標(biāo)注結(jié)果;根據(jù)目標(biāo)標(biāo)注結(jié)果對(duì)最小化問(wèn)句進(jìn)行篩選和內(nèi)容重組,得到目標(biāo)圖像的目標(biāo)描述語(yǔ)句。本發(fā)明提高了圖像自動(dòng)標(biāo)注的全面性和準(zhǔn)確性,可廣泛應(yīng)用于圖像處理技術(shù)領(lǐng)域。

技術(shù)研發(fā)人員:張?jiān)讫?何蔚星,阮宜龍
受保護(hù)的技術(shù)使用者:中電信人工智能科技(北京)有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2024/10/21
當(dāng)前第2頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1