日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

指令數(shù)據(jù)生成方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)與流程

文檔序號(hào):39710050發(fā)布日期:2024-10-22 12:55閱讀:2來源:國知局
指令數(shù)據(jù)生成方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)與流程

本公開涉及人工智能,特別是涉及一種指令數(shù)據(jù)生成方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)。


背景技術(shù):

1、隨著人工智能技術(shù)的發(fā)展,將人工智能模型應(yīng)用于各行各業(yè)能夠極大地推動(dòng)社會(huì)的創(chuàng)新和進(jìn)步。在醫(yī)療、金融、教育、交通等諸多領(lǐng)域,人工智能模型已經(jīng)成為解決問題的關(guān)鍵工具,例如基于人工智能模型的智能問答系統(tǒng)能夠根據(jù)訓(xùn)練中的問題和答案,生成針對(duì)用戶問題的準(zhǔn)確回答。

2、指令數(shù)據(jù)作為人工智能模型訓(xùn)練過程的重要組成部分,能夠引導(dǎo)模型進(jìn)行學(xué)習(xí)并生成符合用戶期望的輸出,指令數(shù)據(jù)對(duì)于提升模型的指令遵循能力、泛化能力等方面存在重要作用。

3、當(dāng)前對(duì)于專業(yè)知識(shí)技術(shù)領(lǐng)域(例如生物醫(yī)學(xué)、法律知識(shí)等),由于缺乏足夠的先驗(yàn)知識(shí)和數(shù)據(jù),指令數(shù)據(jù)的數(shù)據(jù)量較少,難以滿足人工智能模型特別是大語言模型的學(xué)習(xí)訓(xùn)練需求,而通過人工標(biāo)記獲取指令數(shù)據(jù)的方式時(shí)間成本和人力成本都較高。雖然相關(guān)技術(shù)中存在通過深度學(xué)習(xí)模型(例如生成對(duì)抗網(wǎng)絡(luò))或是大語言模型來生成符合需求的指令數(shù)據(jù)的方案,但其數(shù)據(jù)生成方法的適用范圍較窄,僅局限于封閉問答類型和文本分類類型(情感分析)的數(shù)據(jù)生成任務(wù)上,而專業(yè)知識(shí)技術(shù)領(lǐng)域的生成任務(wù)大多屬于開放問答類型,現(xiàn)有的封閉問答類型和文本分類類型的數(shù)據(jù)生成方式無法適用。

4、因此,當(dāng)前的數(shù)據(jù)生成技術(shù)存在數(shù)據(jù)生成成本高、適用范圍窄的技術(shù)問題。


技術(shù)實(shí)現(xiàn)思路

1、基于此,有必要針對(duì)至少一個(gè)上述技術(shù)問題,提供一種低成本、適用范圍廣的指令數(shù)據(jù)生成方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)。

2、在第一方面,本公開的實(shí)施例提供了一種指令數(shù)據(jù)生成方法,該方法包括:

3、從預(yù)設(shè)的問答數(shù)據(jù)集中獲取初始數(shù)據(jù)樣本;

4、將初始數(shù)據(jù)樣本進(jìn)行格式調(diào)整,生成格式樣本,格式樣本至少包括問題項(xiàng)、與問題項(xiàng)對(duì)應(yīng)的選項(xiàng)項(xiàng)和答案項(xiàng);

5、根據(jù)初始數(shù)據(jù)樣本的格式類型,從預(yù)設(shè)的多個(gè)提示模板中,確定目標(biāo)提示模板;

6、根據(jù)格式樣本編輯目標(biāo)提示模板的示例數(shù)據(jù)提示,生成數(shù)據(jù)生成提示;

7、將數(shù)據(jù)生成提示輸入預(yù)設(shè)的模型中,生成用于供人工智能模型進(jìn)行訓(xùn)練學(xué)習(xí)的目標(biāo)指令數(shù)據(jù),其中目標(biāo)指令數(shù)據(jù)與初始數(shù)據(jù)樣本的格式類型一致。

8、其中,格式類型至少包括初始數(shù)據(jù)樣本的答案數(shù)據(jù)為非固定內(nèi)容的開放問答格式和初始數(shù)據(jù)樣本的答案數(shù)據(jù)為固定內(nèi)容的封閉問答格式,提示模板包括用于表示限制相應(yīng)的指令數(shù)據(jù)生成條件的約束提示和用于提供相應(yīng)的指令數(shù)據(jù)生成內(nèi)容參考的示例數(shù)據(jù)提示。

9、在一些實(shí)施例中,示例數(shù)據(jù)提示包括問題標(biāo)簽、選項(xiàng)標(biāo)簽和答案標(biāo)簽。多個(gè)提示模板包括與開放問答格式對(duì)應(yīng)的第一提示模板,和與封閉問答格式對(duì)應(yīng)的第二提示模板。

10、第一提示模板的各個(gè)標(biāo)簽的排列順序依次是問題標(biāo)簽、選項(xiàng)標(biāo)簽和答案標(biāo)簽。

11、第二提示模板的各個(gè)標(biāo)簽的排列順序依次是選項(xiàng)標(biāo)簽、答案標(biāo)簽和問題標(biāo)簽。

12、在一些實(shí)施例中,第二提示模板的約束提示包括選項(xiàng)標(biāo)簽約束提示,選項(xiàng)標(biāo)簽約束提示用于限制指令數(shù)據(jù)中的選項(xiàng)標(biāo)簽內(nèi)容與示例數(shù)據(jù)中的選項(xiàng)標(biāo)簽內(nèi)容保持一致。

13、在一些實(shí)施例中,第一提示模板和第二提示模板的約束提示均包括數(shù)量約束提示、內(nèi)容約束提示和格式約束提示。數(shù)量約束提示、內(nèi)容約束提示和格式約束提示分別用于表示限制相應(yīng)的指令數(shù)據(jù)的數(shù)量、內(nèi)容、輸出格式的約束條件,其中,輸出格式為json格式。

14、在一些實(shí)施例中,目標(biāo)指令數(shù)據(jù)包括多個(gè)問答數(shù)據(jù)。指令數(shù)據(jù)生成方法還可以包括:

15、從多個(gè)問答數(shù)據(jù)中獲取目標(biāo)問答數(shù)據(jù),作為本輪數(shù)據(jù)樣本,根據(jù)本輪數(shù)據(jù)樣本編輯目標(biāo)提示模板的示例數(shù)據(jù),生成本輪數(shù)據(jù)生成提示,將本輪數(shù)據(jù)生成提示輸入預(yù)設(shè)的模型中,生成本輪指令數(shù)據(jù)。

16、在一些實(shí)施例中,本輪指令數(shù)據(jù)包括多個(gè)本輪問答數(shù)據(jù),指令數(shù)據(jù)生成方法還可以包括:

17、從多個(gè)本輪問答數(shù)據(jù)中獲取本輪目標(biāo)問答數(shù)據(jù),作為下一輪數(shù)據(jù)樣本,根據(jù)下一輪數(shù)據(jù)樣本編輯目標(biāo)提示模板的示例數(shù)據(jù),生成下一輪數(shù)據(jù)生成提示,將下一輪數(shù)據(jù)生成提示輸入預(yù)設(shè)的模型中,生成下一輪指令數(shù)據(jù)。

18、在一些實(shí)施例中,從多個(gè)本輪問答數(shù)據(jù)中獲取本輪目標(biāo)問答數(shù)據(jù),作為下一輪數(shù)據(jù)樣本,可以包括:

19、從多個(gè)本輪問答數(shù)據(jù)中隨機(jī)選取本輪目標(biāo)問答數(shù)據(jù),作為下一輪數(shù)據(jù)樣本?;?,

20、從多個(gè)本輪問答數(shù)據(jù)中選取與上一輪的格式樣本語義相似度最高的問答數(shù)據(jù),作為下一輪數(shù)據(jù)樣本?;?,

21、從多個(gè)本輪問答數(shù)據(jù)中選取與上一輪的格式樣本語義相似度最低的問答數(shù)據(jù),作為下一輪數(shù)據(jù)樣本?;?,

22、從多個(gè)本輪問答數(shù)據(jù)中選取與上一輪的格式樣本語義相似度為預(yù)設(shè)值的問答數(shù)據(jù),作為下一輪數(shù)據(jù)樣本。

23、在一些實(shí)施例中,指令數(shù)據(jù)生成方法還可以包括:

24、根據(jù)問答數(shù)據(jù)集的名稱信息和預(yù)設(shè)的對(duì)應(yīng)關(guān)系表,確定初始數(shù)據(jù)樣本的格式類型。其中,對(duì)應(yīng)關(guān)系表用于表示名稱信息和格式類型的對(duì)應(yīng)關(guān)系。

25、在一些實(shí)施例中,預(yù)設(shè)的問答數(shù)據(jù)集為目標(biāo)技術(shù)領(lǐng)域的專業(yè)知識(shí)問答數(shù)據(jù)集。指令數(shù)據(jù)生成方法還可以包括:

26、將目標(biāo)指令數(shù)據(jù)輸入預(yù)設(shè)的人工智能模型中,以使人工智能模型進(jìn)行訓(xùn)練學(xué)習(xí),生成新的人工智能模型,新的人工智能模型具備目標(biāo)技術(shù)領(lǐng)域的專業(yè)知識(shí)能力。

27、或,將目標(biāo)指令數(shù)據(jù)輸入預(yù)設(shè)的人工智能模型中,以供人工智能模型進(jìn)行模型微調(diào),以提升人工智能模型在目標(biāo)技術(shù)領(lǐng)域的指令遵循的能力。

28、在第二方面,本公開的實(shí)施例提供了一種指令數(shù)據(jù)生成裝置,該裝置包括:

29、樣本獲取模塊,用于從預(yù)設(shè)的問答數(shù)據(jù)集中獲取初始數(shù)據(jù)樣本。

30、格式樣本生成模塊,用于將初始數(shù)據(jù)樣本進(jìn)行格式調(diào)整,生成格式樣本,格式樣本至少包括問題項(xiàng)、與問題項(xiàng)對(duì)應(yīng)的選項(xiàng)項(xiàng)和答案項(xiàng)。

31、提示模板確定模塊,用于根據(jù)初始數(shù)據(jù)樣本的格式類型,從預(yù)設(shè)的多個(gè)提示模板中,確定目標(biāo)提示模板。其中,格式類型至少包括初始數(shù)據(jù)樣本的答案為非固定內(nèi)容的開放問答格式和初始數(shù)據(jù)樣本的答案為固定內(nèi)容的封閉問答格式,提示模板包括用于限制相應(yīng)的指令數(shù)據(jù)生成條件的約束提示和用于提供相應(yīng)的指令數(shù)據(jù)生成內(nèi)容參考的示例數(shù)據(jù)提示。

32、提示生成模塊,用于根據(jù)格式樣本編輯目標(biāo)提示模板的示例數(shù)據(jù)提示,生成數(shù)據(jù)生成提示。

33、數(shù)據(jù)生成模塊,用于將數(shù)據(jù)生成提示輸入預(yù)設(shè)的模型中,生成用于供人工智能模型進(jìn)行訓(xùn)練學(xué)習(xí)的目標(biāo)指令數(shù)據(jù)。

34、在第三方面,本公開的實(shí)施例提供了一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,處理器執(zhí)行計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)第一方面本公開的任一實(shí)施例中提供的指令數(shù)據(jù)生成方法的步驟。

35、在第四方面,本公開的實(shí)施例提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)第一方面本公開的任一實(shí)施例中提供的指令數(shù)據(jù)生成方法的步驟。

36、上述指令數(shù)據(jù)生成方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì),從預(yù)設(shè)的問答數(shù)據(jù)集中獲取初始數(shù)據(jù)樣本,根據(jù)初始樣本數(shù)據(jù)的格式類型,確定對(duì)應(yīng)的目標(biāo)提示模板,并根據(jù)初始數(shù)據(jù)樣本進(jìn)行格式調(diào)整后生成的格式樣本,編輯目標(biāo)提示模板中的示例數(shù)據(jù)提示,以生成數(shù)據(jù)生成提示輸入預(yù)設(shè)的模型中,生成目標(biāo)指令數(shù)據(jù),其中,格式類型可以包括開放問答格式和封閉問答格式,提示模板包括約束提示和示例數(shù)據(jù)提示。上述指令數(shù)據(jù)生成方法中,通過預(yù)設(shè)的模型生成指令數(shù)據(jù)具有數(shù)據(jù)生成成本低的效果,同時(shí)預(yù)設(shè)的多個(gè)提示模板能夠覆蓋開放問答格式和封閉問答格式的初始樣本數(shù)據(jù),適用范圍廣,能夠生成與初始數(shù)據(jù)樣本格式類型一致,且滿足約束提示所表示的數(shù)據(jù)生成條件的目標(biāo)指令數(shù)據(jù)。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1