1.一種由一個(gè)或多個(gè)計(jì)算機(jī)執(zhí)行的方法,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其中所述第一噪聲參數(shù)集包括第一噪聲波形。
3.根據(jù)權(quán)利要求2所述的方法,其中將所述第一噪聲參數(shù)集應(yīng)用于所述第一初始音頻波形包括:
4.根據(jù)權(quán)利要求2所述的方法,其中將所述第一噪聲參數(shù)集應(yīng)用于所述第一初始音頻波形包括:
5.根據(jù)任一項(xiàng)前述權(quán)利要求所述的方法,其中所述目標(biāo)函數(shù)通過(guò)多尺度頻譜重構(gòu)損失來(lái)測(cè)量以下之間的所述誤差:(i)所述重構(gòu)音頻波形,以及(ii)通過(guò)將所述第二噪聲參數(shù)集應(yīng)用于所述第一初始音頻波形而生成的所述音頻波形。
6.根據(jù)任一項(xiàng)前述權(quán)利要求所述的方法,其中所述被指定為干凈特征維度的特征維度集與所述被指定為噪聲特征維度的特征維度集不相交。
7.根據(jù)任一項(xiàng)前述權(quán)利要求所述的方法,其中所述輸入音頻波形的所述嵌入包括表示所述輸入音頻波形的多個(gè)特征矢量,其中每個(gè)特征矢量包括:(i)所述被指定為干凈特征維度的特征維度集,以及(ii)所述被指定為噪聲特征維度的特征維度集。
8.根據(jù)任一項(xiàng)前述權(quán)利要求所述的方法,其中生成所述混合嵌入包括對(duì)所述混合嵌入進(jìn)行矢量量化。
9.根據(jù)權(quán)利要求8所述的方法,其中對(duì)所述混合嵌入進(jìn)行矢量量化包括:
10.根據(jù)任一項(xiàng)前述權(quán)利要求所述的方法,其中所述第一初始音頻波形和所述第二初始音頻波形是語(yǔ)音波形或音樂(lè)波形。
11.根據(jù)任一項(xiàng)前述權(quán)利要求所述的方法,其中所述編碼器神經(jīng)網(wǎng)絡(luò)和所述解碼器神經(jīng)網(wǎng)絡(luò)具有相應(yīng)的卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)。
12.根據(jù)任一項(xiàng)前述權(quán)利要求所述的方法,還包括:
13.根據(jù)權(quán)利要求12所述的方法,其中所述目標(biāo)函數(shù)測(cè)量以下之間的誤差:(i)由所述鑒別器神經(jīng)網(wǎng)絡(luò)通過(guò)處理所述重構(gòu)音頻波形而生成的一個(gè)或多個(gè)中間輸出,以及(ii)由所述鑒別器神經(jīng)網(wǎng)絡(luò)通過(guò)處理通過(guò)將所述第二噪聲參數(shù)集應(yīng)用于所述第一初始音頻波形而生成的所述音頻波形而生成的一個(gè)或多個(gè)中間輸出。
14.根據(jù)任一項(xiàng)前述權(quán)利要求所述的方法,還包括:
15.根據(jù)權(quán)利要求14所述的方法,其中通過(guò)將所述第三有噪聲的音頻波形的所述嵌入的所述噪聲特征維度的值設(shè)置為默認(rèn)值來(lái)生成所述干凈嵌入包括:
16.根據(jù)任一項(xiàng)前述權(quán)利要求所述的方法,還包括:
17.根據(jù)任一項(xiàng)前述權(quán)利要求所述的方法,其中確定測(cè)量以下之間的誤差的目標(biāo)函數(shù)的梯度:(i)所述重構(gòu)音頻波形,以及(ii)通過(guò)將所述第二噪聲參數(shù)集應(yīng)用于所述第一初始音頻波形而生成的音頻波形,包括:
18.根據(jù)任一項(xiàng)前述權(quán)利要求所述的方法,其中使用所述梯度來(lái)更新所述編碼器神經(jīng)網(wǎng)絡(luò)和所述解碼器神經(jīng)網(wǎng)絡(luò)的參數(shù)值包括:
19.一種由一個(gè)或多個(gè)計(jì)算機(jī)執(zhí)行的方法,所述方法包括:
20.根據(jù)權(quán)利要求19所述的方法,還包括,在壓縮所述音頻波形的所述量化表示之前:
21.根據(jù)權(quán)利要求19所述的方法,還包括,在壓縮所述音頻波形的所述量化表示之前:
22.根據(jù)權(quán)利要求19所述的方法,其中壓縮所述音頻波形的所述量化嵌入包括:
23.根據(jù)權(quán)利要求19至22中任一項(xiàng)所述的方法,其中壓縮所述音頻波形的所述量化嵌入包括:
24.一種由一個(gè)或多個(gè)計(jì)算機(jī)執(zhí)行的方法,所述方法包括:
25.一種由一個(gè)或多個(gè)計(jì)算機(jī)執(zhí)行的方法,所述方法包括:
26.根據(jù)權(quán)利要求25所述的方法,其中修改所述音頻波形的所述嵌入的所述噪聲特征維度包括:
27.根據(jù)權(quán)利要求25所述的方法,其中修改所述音頻波形的所述嵌入的所述噪聲特征維度包括:
28.一種由一個(gè)或多個(gè)計(jì)算機(jī)執(zhí)行的方法,所述方法包括:
29.一種系統(tǒng),包括:
30.一種或多種非暫時(shí)性計(jì)算機(jī)存儲(chǔ)介質(zhì),所述非暫時(shí)性計(jì)算機(jī)存儲(chǔ)介質(zhì)存儲(chǔ)指令,所述指令在由一個(gè)或多個(gè)計(jì)算機(jī)執(zhí)行時(shí),使所述一個(gè)或多個(gè)計(jì)算機(jī)執(zhí)行根據(jù)權(quán)利要求1至28中任一項(xiàng)所述的相應(yīng)方法的操作。