1.一種聲紋認(rèn)證方法,其特征在于,由客戶端執(zhí)行,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對用戶輸入的認(rèn)證語音進行聲紋特征提取,包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述說話人分類模型是以優(yōu)化三元組損失為訓(xùn)練目標(biāo),對骨干特征提取模型進行訓(xùn)練得到的,其中,所述優(yōu)化三元組損失包括最小化va與vp的距離d1和最大化va與vn的距離,所述va為錨點輸入xa的聲紋特征向量,vp為輸入的正樣本xp的聲紋特征向量,vn為輸入的負(fù)樣本xn的聲紋特征向量。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述端到端聲紋識別模型是以優(yōu)化五元組損失為訓(xùn)練目標(biāo),結(jié)合密鑰數(shù)據(jù)和聲音數(shù)據(jù)對所述初始端到端聲紋識別模型進行訓(xùn)練得到的,其中,所述優(yōu)化五元組損失包括最小化va'與vp1的距離、最大化v?a'與vp2的距離、最大化va'與vn1的距離和最大化v?a與vn2的距離,所述va'為錨點輸入xa與匹配密鑰k1的拼接特征向量,vp1為輸入的正樣本xp與匹配密鑰k1的拼接特征向量,vp2為輸入的正樣本xp與錯誤密鑰k2的拼接特征向量,vn1為輸入的負(fù)樣本xn與匹配密鑰k1的拼接特征向量,vn2為輸入的負(fù)樣本xn與錯誤密鑰k2的拼接特征向量。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取認(rèn)證密鑰,包括:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對用戶輸入的認(rèn)證語音進行聲紋特征提取之前,所述方法還包括:
7.一種聲紋認(rèn)證方法,其特征在于,由服務(wù)端執(zhí)行,所述方法包括:
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述將所述認(rèn)證聲紋特征模板與預(yù)先存儲的注冊聲紋特征模板進行匹配,以確定聲紋認(rèn)證結(jié)果,包括:
9.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述接收客戶端發(fā)送的認(rèn)證聲紋特征模板之前,所述方法還包括:
10.根據(jù)權(quán)利要求9所述的方法,其特征在于,所述訓(xùn)練說話人分類模型,包括:
11.根據(jù)權(quán)利要求9所述的方法,其特征在于,所述結(jié)合密鑰數(shù)據(jù)與聲音數(shù)據(jù)對所述初始端到端聲紋識別模型進行訓(xùn)練,得到訓(xùn)練好的端到端聲紋識別模型,包括:
12.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述接收客戶端發(fā)送的認(rèn)證聲紋特征模板之前,所述方法還包括:
13.一種聲紋認(rèn)證裝置,其特征在于,設(shè)置在客戶端,所述聲紋認(rèn)證裝置包括:
14.一種聲紋認(rèn)證裝置,其特征在于,設(shè)置在服務(wù)端,所述聲紋認(rèn)證裝置包括:
15.一種客戶端,其特征在于,包括收發(fā)機和處理器,其中,
16.一種服務(wù)端,其特征在于,包括收發(fā)機和處理器,其中,
17.一種聲紋認(rèn)證系統(tǒng),其特征在于,包括客戶端和服務(wù)端,其中,
18.一種電子設(shè)備,包括:收發(fā)機、存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序;其特征在于,所述處理器,用于讀取存儲器中的程序?qū)崿F(xiàn)如權(quán)利要求1至6中任一項所述的聲紋認(rèn)證方法中的步驟;或者實現(xiàn)如權(quán)利要求7至12中任一項所述的聲紋認(rèn)證方法中的步驟。
19.一種計算機可讀存儲介質(zhì),用于存儲計算機程序,其特征在于,所述計算機程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1至6中任一項所述的聲紋認(rèn)證方法中的步驟;或者實現(xiàn)如權(quán)利要求7至12中任一項所述的聲紋認(rèn)證方法中的步驟。