日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

任務(wù)型對(duì)話模型訓(xùn)練方法、裝置及設(shè)備與流程

文檔序號(hào):39724039發(fā)布日期:2024-10-22 13:20閱讀:1來(lái)源:國(guó)知局
任務(wù)型對(duì)話模型訓(xùn)練方法、裝置及設(shè)備與流程

本發(fā)明涉及數(shù)據(jù)處理,尤其是指一種任務(wù)型對(duì)話模型訓(xùn)練方法、裝置及設(shè)備。


背景技術(shù):

1、任務(wù)型對(duì)話系統(tǒng)可以協(xié)助用戶完成特定的任務(wù),在人類語(yǔ)言和機(jī)器api之間建立接口。通常情況下,任務(wù)型對(duì)話系統(tǒng)需要了解用戶的需求,與數(shù)據(jù)庫(kù)中匹配的實(shí)體進(jìn)行溝通,決定如何回答,并給出自然語(yǔ)言回復(fù)。

2、隨著以gpt-2為代表的預(yù)訓(xùn)練語(yǔ)言模型的迅速崛起,通過(guò)為任務(wù)型對(duì)話系統(tǒng)微調(diào)預(yù)訓(xùn)練語(yǔ)言模型,實(shí)現(xiàn)了最先進(jìn)的性能和出色的領(lǐng)域轉(zhuǎn)移能力.然而現(xiàn)有的基于預(yù)訓(xùn)練語(yǔ)言模型的方法存在記憶異?;貜?fù)的問(wèn)題:模型從嘈雜的對(duì)話語(yǔ)料庫(kù)學(xué)習(xí)后會(huì)記住攻擊性行為。由于尾部過(guò)擬合現(xiàn)象,可能會(huì)記憶并生成一些不專業(yè)的、不禮貌的、甚至是攻擊性的回復(fù),這也限制了該方法的應(yīng)用。

3、在開(kāi)放領(lǐng)域的聊天機(jī)器人中,用于阻止攻擊性、道德敏感和歧視性的句子的生成,通常采用以下兩類方式:一類使用分類器來(lái)檢測(cè)攻擊性回復(fù),并用預(yù)先設(shè)計(jì)的安全回復(fù)取代它們。另一類則是應(yīng)用受控文本生成的方法并學(xué)習(xí)安全控制屬性來(lái)引導(dǎo)回復(fù)生成的過(guò)程。然而,這些關(guān)于聊天機(jī)器人的方法并不直接適用于任務(wù)型對(duì)話系統(tǒng),由于任務(wù)型對(duì)話系統(tǒng)需要完成用戶特定的任務(wù),而這些方法往往會(huì)刪除任務(wù)相關(guān)的信息(例如,餐廳地址)進(jìn)而阻礙任務(wù)的完成,并且由于它們通常需要對(duì)回復(fù)的安全性進(jìn)行額外的成本注釋,因此系統(tǒng)的遷移性也比較差。


技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明技術(shù)方案的目的在于提供一種任務(wù)型對(duì)話模型訓(xùn)練方法、裝置及設(shè)備,用于解決現(xiàn)有技術(shù)任務(wù)型對(duì)話系統(tǒng),造成回復(fù)信息缺失以及需要額外標(biāo)注,導(dǎo)致成本消耗和系統(tǒng)遷移性能差的問(wèn)題。

2、本發(fā)明實(shí)施例提供一種任務(wù)型對(duì)話模型訓(xùn)練方法,其中,包括:

3、根據(jù)歷史對(duì)話訓(xùn)練集,構(gòu)建關(guān)鍵詞c對(duì)應(yīng)的回復(fù)簇;其中,所述回復(fù)簇包括多個(gè)以所述關(guān)鍵詞c為意圖-槽的去詞匯化回復(fù);所述去詞匯化回復(fù)根據(jù)所述歷史對(duì)話訓(xùn)練集中的訓(xùn)練數(shù)據(jù)進(jìn)行去詞匯化處理后獲得;

4、對(duì)所述回復(fù)簇中的多個(gè)去詞匯化回復(fù)分別在所述回復(fù)簇中進(jìn)行采樣,獲得所述多個(gè)去詞匯化回復(fù)分別對(duì)應(yīng)的采樣偽回復(fù);

5、將所述采樣偽回復(fù)作為偽標(biāo)簽,所述回復(fù)簇中的多個(gè)去詞匯化回復(fù)作為訓(xùn)練數(shù)據(jù),對(duì)任務(wù)對(duì)話轉(zhuǎn)述模型進(jìn)行訓(xùn)練,獲得任務(wù)回復(fù)模型。

6、可選地,所述的方法,其中,所述任務(wù)對(duì)話轉(zhuǎn)述模型包括以目標(biāo)訓(xùn)練參數(shù)θp為標(biāo)簽,所述去詞化回復(fù)對(duì)應(yīng)轉(zhuǎn)述后回復(fù)的概率函數(shù)。

7、可選地,所述的方法,其中,對(duì)所述回復(fù)簇中的多個(gè)去詞化回復(fù)分別在所述回復(fù)簇中進(jìn)行采樣,獲得所述多個(gè)去詞化回復(fù)分別對(duì)應(yīng)的偽標(biāo)簽,包括:

8、利用預(yù)設(shè)采樣函數(shù),對(duì)所述回復(fù)簇中的多個(gè)去詞化回復(fù)分別在所述回復(fù)簇中進(jìn)行采樣,獲得所述多個(gè)去詞化回復(fù)分別對(duì)應(yīng)的偽標(biāo)簽;其中,所述預(yù)設(shè)采樣函數(shù)包括歸一化指數(shù)函數(shù)softmax和/或max函數(shù)。

9、可選地,所述的方法,其中,所述預(yù)設(shè)采樣函數(shù)表示為采樣偽回復(fù)、所述歷史對(duì)話訓(xùn)練集中回復(fù)的意圖-槽組合與所述回復(fù)相對(duì)應(yīng)回復(fù)簇的候選回復(fù)的對(duì)應(yīng)關(guān)系。

10、可選地,所述的方法,其中,所述方法還包括:

11、對(duì)所述回復(fù)簇中的多個(gè)去詞化回復(fù)分別在所述回復(fù)簇中進(jìn)行多目標(biāo)采樣,獲得每一去詞匯化回復(fù)分別對(duì)應(yīng)的多個(gè)采樣偽回復(fù);

12、根據(jù)采樣所獲得的多個(gè)采樣偽回復(fù),計(jì)算所述任務(wù)對(duì)話轉(zhuǎn)述模型的第一損失函數(shù)。

13、可選地,所述的方法,其中,所述任務(wù)回復(fù)模型用于根據(jù)輸入的去詞化回復(fù),輸出對(duì)應(yīng)所述去詞化回復(fù)的被轉(zhuǎn)述回復(fù)和所述去詞化回復(fù)對(duì)應(yīng)的意圖-槽;

14、其中,所述方法還包括:

15、根據(jù)所述意圖-槽的槽序列和所述被轉(zhuǎn)述回復(fù)的長(zhǎng)度,計(jì)算所述任務(wù)對(duì)話轉(zhuǎn)述模型的第二損失函數(shù)。

16、可選地,所述的方法,其中,對(duì)任務(wù)對(duì)話轉(zhuǎn)述模型進(jìn)行訓(xùn)練的過(guò)程包括多個(gè)子訓(xùn)練過(guò)程;

17、其中,對(duì)所述任務(wù)對(duì)話轉(zhuǎn)述模型進(jìn)行訓(xùn)練,包括:

18、依據(jù)執(zhí)行所述任務(wù)對(duì)話轉(zhuǎn)述模型的所述多個(gè)子訓(xùn)練過(guò)程。

19、本發(fā)明其中一實(shí)施例還提供一種任務(wù)型對(duì)話模型訓(xùn)練裝置,其中,包括:

20、數(shù)據(jù)處理單元,用于根據(jù)歷史對(duì)話訓(xùn)練集,構(gòu)建關(guān)鍵詞c對(duì)應(yīng)的回復(fù)簇;其中,所述回復(fù)簇包括多個(gè)以所述關(guān)鍵詞c為意圖-槽的去詞匯化回復(fù);所述去詞化回復(fù)根據(jù)所述歷史對(duì)話訓(xùn)練集中的訓(xùn)練數(shù)據(jù)進(jìn)行去詞匯化處理后獲得;

21、采樣單元,用于對(duì)所述回復(fù)簇中的多個(gè)去詞化回復(fù)分別在所述回復(fù)簇中進(jìn)行采樣,獲得所述多個(gè)去詞化回復(fù)分別對(duì)應(yīng)的采樣偽回復(fù);

22、訓(xùn)練單元,用于將所述采樣偽回復(fù)作為偽標(biāo)簽,所述回復(fù)簇中的多個(gè)去詞化回復(fù)作為訓(xùn)練數(shù)據(jù),對(duì)任務(wù)對(duì)話轉(zhuǎn)述模型進(jìn)行訓(xùn)練,獲得任務(wù)回復(fù)模型。

23、本發(fā)明其中一實(shí)施例還提供一種網(wǎng)絡(luò)設(shè)備,其中,包括處理器、存儲(chǔ)器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的程序,所述程序被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)如上任一項(xiàng)所述的任務(wù)型對(duì)話模型訓(xùn)練方法。

24、本發(fā)明其中一實(shí)施例還提供一種可讀存儲(chǔ)介質(zhì),其中,所述可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有程序,所述程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上任一項(xiàng)所述的任務(wù)型對(duì)話模型訓(xùn)練方法中的步驟。

25、本發(fā)明上述技術(shù)方案中的至少一個(gè)具有以下有益效果:

26、采用本發(fā)明實(shí)施例所述任務(wù)型對(duì)話模型訓(xùn)練方法,通過(guò)構(gòu)建歷史對(duì)話訓(xùn)練集中關(guān)鍵詞對(duì)應(yīng)的回復(fù)簇,對(duì)回復(fù)簇中的多個(gè)去詞匯化回復(fù)分別在回復(fù)簇中進(jìn)行采樣,獲得多個(gè)去詞匯化回復(fù)分別對(duì)應(yīng)的采樣偽回復(fù),這樣利用采樣偽回復(fù)作為偽標(biāo)簽,以回復(fù)簇中的多個(gè)去詞匯化回復(fù)作為訓(xùn)練數(shù)據(jù),對(duì)任務(wù)對(duì)話轉(zhuǎn)述模型進(jìn)行訓(xùn)練,能夠獲得任務(wù)回復(fù)模型,實(shí)現(xiàn)采用偽標(biāo)簽的自監(jiān)督方法的訓(xùn)練,解決了現(xiàn)有技術(shù)檢測(cè)攻擊性回復(fù)的過(guò)程,需要對(duì)回復(fù)的安全性進(jìn)行額外標(biāo)注,從而消耗額外的標(biāo)注成本,造成回復(fù)信息缺失、導(dǎo)致成本消耗和系統(tǒng)遷移性能差的問(wèn)題。



技術(shù)特征:

1.一種任務(wù)型對(duì)話模型訓(xùn)練方法,其特征在于,包括:

2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述任務(wù)對(duì)話轉(zhuǎn)述模型包括以目標(biāo)訓(xùn)練參數(shù)θp為標(biāo)簽,所述去詞化回復(fù)對(duì)應(yīng)轉(zhuǎn)述后回復(fù)的概率函數(shù)。

3.根據(jù)權(quán)利要求1所述的方法,其特征在于,對(duì)所述回復(fù)簇中的多個(gè)去詞化回復(fù)分別在所述回復(fù)簇中進(jìn)行采樣,獲得所述多個(gè)去詞化回復(fù)分別對(duì)應(yīng)的偽標(biāo)簽,包括:

4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述預(yù)設(shè)采樣函數(shù)表示為采樣偽回復(fù)、所述歷史對(duì)話訓(xùn)練集中回復(fù)的意圖-槽組合與所述回復(fù)相對(duì)應(yīng)回復(fù)簇的候選回復(fù)的對(duì)應(yīng)關(guān)系。

5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:

6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述任務(wù)回復(fù)模型用于根據(jù)輸入的去詞化回復(fù),輸出對(duì)應(yīng)所述去詞化回復(fù)的被轉(zhuǎn)述回復(fù)和所述去詞化回復(fù)對(duì)應(yīng)的意圖-槽;

7.根據(jù)權(quán)利要求1所述的方法,其特征在于,對(duì)任務(wù)對(duì)話轉(zhuǎn)述模型進(jìn)行訓(xùn)練的過(guò)程包括多個(gè)子訓(xùn)練過(guò)程;

8.一種任務(wù)型對(duì)話模型訓(xùn)練裝置,其特征在于,包括:

9.一種網(wǎng)絡(luò)設(shè)備,其特征在于,包括處理器、存儲(chǔ)器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的程序,所述程序被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一項(xiàng)所述的任務(wù)型對(duì)話模型訓(xùn)練方法。

10.一種可讀存儲(chǔ)介質(zhì),其特征在于,所述可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有程序,所述程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一項(xiàng)所述的任務(wù)型對(duì)話模型訓(xùn)練方法中的步驟。


技術(shù)總結(jié)
本發(fā)明提供一種任務(wù)型對(duì)話模型訓(xùn)練方法、裝置及設(shè)備。所述方法包括:根據(jù)歷史對(duì)話訓(xùn)練集,構(gòu)建關(guān)鍵詞C對(duì)應(yīng)的回復(fù)簇;所述回復(fù)簇包括多個(gè)以關(guān)鍵詞C為意圖?槽的去詞匯化回復(fù);去詞匯化回復(fù)根據(jù)歷史對(duì)話訓(xùn)練集中的訓(xùn)練數(shù)據(jù)進(jìn)行去詞匯化處理后獲得;對(duì)回復(fù)簇中的多個(gè)去詞匯化回復(fù)分別在回復(fù)簇中進(jìn)行采樣,獲得多個(gè)去詞匯化回復(fù)分別對(duì)應(yīng)的采樣偽回復(fù);將采樣偽回復(fù)作為偽標(biāo)簽,回復(fù)簇中的多個(gè)去詞匯化回復(fù)作為訓(xùn)練數(shù)據(jù),對(duì)任務(wù)對(duì)話轉(zhuǎn)述模型進(jìn)行訓(xùn)練,獲得任務(wù)回復(fù)模型。采用該方法,能夠解決現(xiàn)有技術(shù)任務(wù)型對(duì)話系統(tǒng),造成回復(fù)信息缺失以及需要額外標(biāo)注,導(dǎo)致成本消耗和系統(tǒng)遷移性能差的問(wèn)題。

技術(shù)研發(fā)人員:黃毅,張朔,馮俊蘭,王平輝,梁子
受保護(hù)的技術(shù)使用者:中國(guó)移動(dòng)通信有限公司研究院
技術(shù)研發(fā)日:
技術(shù)公布日:2024/10/21
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1