1.一種基于殘差網(wǎng)絡的跨模態(tài)聲源定位方法,其特征在于,包括以下步驟;
2.根據(jù)權利要求1所述的一種基于殘差網(wǎng)絡的跨模態(tài)聲源定位方法,其特征在于,所述步驟1中麥克風陣列板由64個數(shù)字微機電系統(tǒng)麥克風陣元組成,陣元間距為d,呈螺旋形排列,紅外熱像儀位于多通道麥克風陣元中心,負責拍攝現(xiàn)場熱圖像。
3.根據(jù)權利要求2所述的一種基于殘差網(wǎng)絡的跨模態(tài)聲源定位方法,其特征在于,所述步驟1包括以下子步驟:
4.根據(jù)權利要求1所述的一種基于殘差網(wǎng)絡的跨模態(tài)聲源定位方法,其特征在于,所述步驟2具體包括以下子步驟:
5.根據(jù)權利要求4所述的一種基于殘差網(wǎng)絡的跨模態(tài)聲源定位方法,其特征在于,所述步驟3具體包括以下子步驟:
6.根據(jù)權利要求5所述的一種基于殘差網(wǎng)絡的跨模態(tài)聲源定位方法,其特征在于,所述步驟4具體包括以下子步驟:
7.根據(jù)權利要求6所述的一種基于殘差網(wǎng)絡的跨模態(tài)聲源定位方法,其特征在于,所述步驟5具體包括以下子步驟:
8.根據(jù)權利要求7所述的一種基于殘差網(wǎng)絡的跨模態(tài)聲源定位方法,其特征在于,所述步驟6中定義注意力函數(shù)f,將熱圖像v與聲源估計坐標圖a輸入音頻引導的注意力函數(shù),得到由音頻信息引導的視覺結果,實現(xiàn)聲源的跨模態(tài)定位: