日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

使用結(jié)構(gòu)化潛在空間壓縮音頻波形的制作方法

文檔序號(hào):39725798發(fā)布日期:2024-10-22 13:24閱讀:來(lái)源:國(guó)知局

技術(shù)特征:

1.一種由一個(gè)或多個(gè)計(jì)算機(jī)執(zhí)行的方法,所述方法包括:

2.根據(jù)權(quán)利要求1所述的方法,其中所述第一噪聲參數(shù)集包括第一噪聲波形。

3.根據(jù)權(quán)利要求2所述的方法,其中將所述第一噪聲參數(shù)集應(yīng)用于所述第一初始音頻波形包括:

4.根據(jù)權(quán)利要求2所述的方法,其中將所述第一噪聲參數(shù)集應(yīng)用于所述第一初始音頻波形包括:

5.根據(jù)任一項(xiàng)前述權(quán)利要求所述的方法,其中所述目標(biāo)函數(shù)通過(guò)多尺度頻譜重構(gòu)損失來(lái)測(cè)量以下之間的所述誤差:(i)所述重構(gòu)音頻波形,以及(ii)通過(guò)將所述第二噪聲參數(shù)集應(yīng)用于所述第一初始音頻波形而生成的所述音頻波形。

6.根據(jù)任一項(xiàng)前述權(quán)利要求所述的方法,其中所述被指定為干凈特征維度的特征維度集與所述被指定為噪聲特征維度的特征維度集不相交。

7.根據(jù)任一項(xiàng)前述權(quán)利要求所述的方法,其中所述輸入音頻波形的所述嵌入包括表示所述輸入音頻波形的多個(gè)特征矢量,其中每個(gè)特征矢量包括:(i)所述被指定為干凈特征維度的特征維度集,以及(ii)所述被指定為噪聲特征維度的特征維度集。

8.根據(jù)任一項(xiàng)前述權(quán)利要求所述的方法,其中生成所述混合嵌入包括對(duì)所述混合嵌入進(jìn)行矢量量化。

9.根據(jù)權(quán)利要求8所述的方法,其中對(duì)所述混合嵌入進(jìn)行矢量量化包括:

10.根據(jù)任一項(xiàng)前述權(quán)利要求所述的方法,其中所述第一初始音頻波形和所述第二初始音頻波形是語(yǔ)音波形或音樂(lè)波形。

11.根據(jù)任一項(xiàng)前述權(quán)利要求所述的方法,其中所述編碼器神經(jīng)網(wǎng)絡(luò)和所述解碼器神經(jīng)網(wǎng)絡(luò)具有相應(yīng)的卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)。

12.根據(jù)任一項(xiàng)前述權(quán)利要求所述的方法,還包括:

13.根據(jù)權(quán)利要求12所述的方法,其中所述目標(biāo)函數(shù)測(cè)量以下之間的誤差:(i)由所述鑒別器神經(jīng)網(wǎng)絡(luò)通過(guò)處理所述重構(gòu)音頻波形而生成的一個(gè)或多個(gè)中間輸出,以及(ii)由所述鑒別器神經(jīng)網(wǎng)絡(luò)通過(guò)處理通過(guò)將所述第二噪聲參數(shù)集應(yīng)用于所述第一初始音頻波形而生成的所述音頻波形而生成的一個(gè)或多個(gè)中間輸出。

14.根據(jù)任一項(xiàng)前述權(quán)利要求所述的方法,還包括:

15.根據(jù)權(quán)利要求14所述的方法,其中通過(guò)將所述第三有噪聲的音頻波形的所述嵌入的所述噪聲特征維度的值設(shè)置為默認(rèn)值來(lái)生成所述干凈嵌入包括:

16.根據(jù)任一項(xiàng)前述權(quán)利要求所述的方法,還包括:

17.根據(jù)任一項(xiàng)前述權(quán)利要求所述的方法,其中確定測(cè)量以下之間的誤差的目標(biāo)函數(shù)的梯度:(i)所述重構(gòu)音頻波形,以及(ii)通過(guò)將所述第二噪聲參數(shù)集應(yīng)用于所述第一初始音頻波形而生成的音頻波形,包括:

18.根據(jù)任一項(xiàng)前述權(quán)利要求所述的方法,其中使用所述梯度來(lái)更新所述編碼器神經(jīng)網(wǎng)絡(luò)和所述解碼器神經(jīng)網(wǎng)絡(luò)的參數(shù)值包括:

19.一種由一個(gè)或多個(gè)計(jì)算機(jī)執(zhí)行的方法,所述方法包括:

20.根據(jù)權(quán)利要求19所述的方法,還包括,在壓縮所述音頻波形的所述量化表示之前:

21.根據(jù)權(quán)利要求19所述的方法,還包括,在壓縮所述音頻波形的所述量化表示之前:

22.根據(jù)權(quán)利要求19所述的方法,其中壓縮所述音頻波形的所述量化嵌入包括:

23.根據(jù)權(quán)利要求19至22中任一項(xiàng)所述的方法,其中壓縮所述音頻波形的所述量化嵌入包括:

24.一種由一個(gè)或多個(gè)計(jì)算機(jī)執(zhí)行的方法,所述方法包括:

25.一種由一個(gè)或多個(gè)計(jì)算機(jī)執(zhí)行的方法,所述方法包括:

26.根據(jù)權(quán)利要求25所述的方法,其中修改所述音頻波形的所述嵌入的所述噪聲特征維度包括:

27.根據(jù)權(quán)利要求25所述的方法,其中修改所述音頻波形的所述嵌入的所述噪聲特征維度包括:

28.一種由一個(gè)或多個(gè)計(jì)算機(jī)執(zhí)行的方法,所述方法包括:

29.一種系統(tǒng),包括:

30.一種或多種非暫時(shí)性計(jì)算機(jī)存儲(chǔ)介質(zhì),所述非暫時(shí)性計(jì)算機(jī)存儲(chǔ)介質(zhì)存儲(chǔ)指令,所述指令在由一個(gè)或多個(gè)計(jì)算機(jī)執(zhí)行時(shí),使所述一個(gè)或多個(gè)計(jì)算機(jī)執(zhí)行根據(jù)權(quán)利要求1至28中任一項(xiàng)所述的相應(yīng)方法的操作。


技術(shù)總結(jié)
用于訓(xùn)練編碼器神經(jīng)網(wǎng)絡(luò)和解碼器神經(jīng)網(wǎng)絡(luò)的方法、系統(tǒng)和設(shè)備,包括編碼在計(jì)算機(jī)存儲(chǔ)介質(zhì)上的計(jì)算機(jī)程序。在一個(gè)方面,一種方法包括:獲得第一初始音頻波形和第一有噪聲的音頻波形;獲得第二初始音頻波形和第二有噪聲的音頻波形;使用編碼器神經(jīng)網(wǎng)絡(luò)來(lái)處理該第一有噪聲的音頻波形和該第二有噪聲的音頻波形;通過(guò)連結(jié)以下來(lái)生成混合嵌入:(i)來(lái)自該第一有噪聲的音頻波形的嵌入的干凈特征維度,以及(ii)來(lái)自該第二有噪聲的音頻波形的嵌入的噪聲特征維度;使用解碼器神經(jīng)網(wǎng)絡(luò)來(lái)處理該混合嵌入,以生成重構(gòu)音頻波形;確定目標(biāo)函數(shù)的梯度;以及使用梯度來(lái)更新該編碼器神經(jīng)網(wǎng)絡(luò)和該解碼器神經(jīng)網(wǎng)絡(luò)的參數(shù)值。

技術(shù)研發(fā)人員:艾哈邁德·歐姆蘭,尼爾·澤格多爾,佐蘭·博爾紹什,費(fèi)利克斯·得肖蒙格泰,馬爾科·塔利亞薩基
受保護(hù)的技術(shù)使用者:谷歌有限責(zé)任公司
技術(shù)研發(fā)日:
技術(shù)公布日:2024/10/21
當(dāng)前第2頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1