1.一種圖像自動(dòng)標(biāo)注方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種圖像自動(dòng)標(biāo)注方法,其特征在于,所述多模態(tài)大模型包括卷積層、注意力模塊、空間金字塔池化層、特征融合層以及全連接層,所述卷積層用于提取輸入圖像的第一圖像特征,所述注意力模塊用于基于通道注意力機(jī)制和空間注意力機(jī)制對(duì)所述第一圖像特征進(jìn)行特征加強(qiáng)得到第二圖像特征,所述空間金字塔池化層用于對(duì)所述第二圖像特征進(jìn)行不同尺度的池化操作得到多尺度圖像特征,所述特征融合層用于對(duì)所述多尺度圖像特征進(jìn)行特征融合得到多模態(tài)融合特征,所述全連接層用于根據(jù)所述多模態(tài)融合特征輸出對(duì)應(yīng)的圖像標(biāo)注結(jié)果。
3.根據(jù)權(quán)利要求1所述的一種圖像自動(dòng)標(biāo)注方法,其特征在于,所述將所述標(biāo)注數(shù)據(jù)集輸入到所述多模態(tài)大模型,得到訓(xùn)練好的圖像標(biāo)注模型,其具體包括:
4.根據(jù)權(quán)利要求1所述的一種圖像自動(dòng)標(biāo)注方法,其特征在于,所述將所述初始描述語(yǔ)句拆解為多個(gè)最小化問(wèn)句,其具體為:
5.根據(jù)權(quán)利要求1所述的一種圖像自動(dòng)標(biāo)注方法,其特征在于,所述將所述目標(biāo)圖像和所述最小化問(wèn)句輸入到所述圖像標(biāo)注模型,得到各所述最小化問(wèn)句對(duì)應(yīng)的目標(biāo)標(biāo)注結(jié)果,其具體包括:
6.根據(jù)權(quán)利要求5所述的一種圖像自動(dòng)標(biāo)注方法,其特征在于,所述根據(jù)所述目標(biāo)標(biāo)注結(jié)果對(duì)所述最小化問(wèn)句進(jìn)行篩選和內(nèi)容重組,得到所述目標(biāo)圖像的目標(biāo)描述語(yǔ)句,其具體包括:
7.根據(jù)權(quán)利要求1至6中任一項(xiàng)所述的一種圖像自動(dòng)標(biāo)注方法,其特征在于,所述根據(jù)所述目標(biāo)標(biāo)注結(jié)果對(duì)所述最小化問(wèn)句進(jìn)行篩選和內(nèi)容重組之前,還包括:
8.一種圖像自動(dòng)標(biāo)注系統(tǒng),其特征在于,包括:
9.一種電子設(shè)備,其特征在于,所述電子設(shè)備包括存儲(chǔ)器、處理器、存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的程序以及用于實(shí)現(xiàn)所述處理器和所述存儲(chǔ)器之間的連接通信的數(shù)據(jù)總線,所述程序被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7中任一項(xiàng)所述的圖像自動(dòng)標(biāo)注方法的步驟。
10.一種存儲(chǔ)介質(zhì),所述存儲(chǔ)介質(zhì)為計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),用于計(jì)算機(jī)可讀存儲(chǔ),其特征在于,所述存儲(chǔ)介質(zhì)存儲(chǔ)有一個(gè)或者多個(gè)程序,所述一個(gè)或者多個(gè)程序可被一個(gè)或者多個(gè)處理器執(zhí)行,以實(shí)現(xiàn)如權(quán)利要求1至7中任一項(xiàng)所述的圖像自動(dòng)標(biāo)注方法的步驟。