日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

數(shù)據(jù)處理裝置、系統(tǒng)、數(shù)據(jù)處理方法及計算機設(shè)備與流程

文檔序號:39729059發(fā)布日期:2024-10-22 13:33閱讀:6來源:國知局
數(shù)據(jù)處理裝置、系統(tǒng)、數(shù)據(jù)處理方法及計算機設(shè)備與流程

本公開涉及計算機硬件,具體而言,涉及一種數(shù)據(jù)處理裝置、系統(tǒng)、數(shù)據(jù)處理方法及計算機設(shè)備。


背景技術(shù):

1、人工智能作為新一輪科技革命和產(chǎn)業(yè)變革的核心驅(qū)動力,正快速催生新產(chǎn)品、新服務(wù)、新業(yè)態(tài),重塑著經(jīng)濟社會運行模式,改變?nèi)祟惿a(chǎn)和生活方式。大語言模型作為人工智能的一項重要成果,在很多領(lǐng)域得到廣泛應(yīng)用。而大語言模型在執(zhí)行處理任務(wù)時依賴于硬件;硬件的處理效率影響著大語言模型的任務(wù)處理效率。


技術(shù)實現(xiàn)思路

1、本公開實施例至少提供一種數(shù)據(jù)處理裝置、系統(tǒng)、數(shù)據(jù)處理方法及計算機設(shè)備。

2、第一方面,本公開實施例提供了一種數(shù)據(jù)處理裝置,包括:數(shù)據(jù)輸入單元、多個處理單元、以及合并單元;

3、所述數(shù)據(jù)輸入單元,用于獲取大語言模型的目標(biāo)處理塊對應(yīng)的待處理數(shù)據(jù),并向多個數(shù)據(jù)處理單元傳輸所述待處理數(shù)據(jù);所述大語言模型包括:多個由注意力網(wǎng)絡(luò)、以及前饋神經(jīng)網(wǎng)絡(luò)構(gòu)成的網(wǎng)絡(luò)層;所述目標(biāo)處理塊包括下述至少一項:所述網(wǎng)絡(luò)層、所述注意力網(wǎng)絡(luò)、前饋神經(jīng)網(wǎng)絡(luò)、由所述注意力網(wǎng)絡(luò)劃分成的第一子網(wǎng)絡(luò)、以及由前饋神經(jīng)網(wǎng)絡(luò)劃分成的第二子網(wǎng)絡(luò);

4、多個所述處理單元中的每個處理單元,用于對所述待處理數(shù)據(jù)執(zhí)行與所述目標(biāo)處理塊的數(shù)據(jù)處理功能對應(yīng)的目標(biāo)處理,得到每個所述處理單元對應(yīng)的結(jié)果數(shù)據(jù);其中,不同所述處理單元對所述待處理數(shù)據(jù)進行所述目標(biāo)處理時使用的處理參數(shù)不同,處理方式相同;

5、所述合并單元,用于對多個所述處理單元分別輸出的結(jié)果數(shù)據(jù)進行合并處理,得到與所述目標(biāo)處理塊對應(yīng)的目標(biāo)數(shù)據(jù)。

6、一種可能的實施方式中,還包括:廣播單元;

7、所述數(shù)據(jù)輸入單元,在向多個數(shù)據(jù)處理單元傳輸所述待處理數(shù)據(jù)時,用于:

8、向所述廣播單元發(fā)送所述待處理數(shù)據(jù);

9、所述廣播單元,用于響應(yīng)于接收到所述數(shù)據(jù)輸入單元傳輸?shù)拇幚頂?shù)據(jù),根據(jù)預(yù)先建立的所述廣播單元和多個所述處理單元之間的連接關(guān)系,向多個所述處理單元廣播所述待處理數(shù)據(jù)。

10、一種可能的實施方式中,所述數(shù)據(jù)輸入單元,在向多個數(shù)據(jù)處理單元傳輸所述待處理數(shù)據(jù)之前,還用于:

11、對所述待處理數(shù)據(jù)進行分割處理,得到多組待處理子數(shù)據(jù);不同待處理數(shù)據(jù)對應(yīng)不同的處理周期;

12、所述數(shù)據(jù)輸入單元,在將所述待處理數(shù)據(jù)傳輸至多個處理單元時,用于:

13、在多個所述處理周期中的每個處理周期,向多個所述處理單元傳輸所述每個處理周期對應(yīng)的待處理子數(shù)據(jù)。

14、一種可能的實施方式中,所述處理單元包括:運算矩陣;所述運算矩陣包括多個由硬件電路構(gòu)成的運算器;

15、所述數(shù)據(jù)輸入單元,在對所述待處理數(shù)據(jù)進行分割處理,得到多組待處理子數(shù)據(jù)時,用于:

16、確定所待處理數(shù)據(jù)所構(gòu)成的矩陣寬度;

17、將所述矩陣寬度和所述運算矩陣中運算器的數(shù)量進行比對;

18、在所述矩陣寬度小于或等于所述運算器的數(shù)量的情況下,對所述待處理數(shù)據(jù)構(gòu)成的矩陣進行按行分割,得到多組所述待處理子數(shù)據(jù);

19、在所述矩陣寬度大于或者等于所述運算器的數(shù)量的情況下,對所述待處理數(shù)據(jù)構(gòu)成的矩陣進行按列分割,得到多組所述待處理子數(shù)據(jù)。

20、一種可能的實施方式中,所述運算器包括下述至少一種:乘加器、比較器、累加器、以及除法器。

21、一種可能的實施方式中,所述合并單元,在對多個所述處理單元分別輸出的結(jié)果數(shù)據(jù)進行合并處理,得到對所述待處理數(shù)據(jù)對應(yīng)的目標(biāo)數(shù)據(jù)時,用于:

22、在多個所述處理周期中的每個處理周期,將所述每個處理周期對應(yīng)的結(jié)果數(shù)據(jù)進行第一合并處理,得到每個所述處理周期對應(yīng)的合并結(jié)果數(shù)據(jù);

23、將多個所述處理周期分別對應(yīng)的合并結(jié)果數(shù)據(jù)進行第二合并處理,得到所述目標(biāo)數(shù)據(jù)。

24、一種可能的實施方式中,還包括:配置單元;

25、所述配置單元,用于對多個所述處理單元進行處理參數(shù)的配置,將每個所述處理單元對應(yīng)的處理參數(shù)存儲到與該處理單元關(guān)聯(lián)的存儲空間中;

26、和/或,用于對所述合并單元進行合并方式的配置。

27、第二方面,本公開實施例還提供一種數(shù)據(jù)處理系統(tǒng),包括:

28、多個第一方面、或第一方面任一項所述的數(shù)據(jù)處理裝置、以及控制器;

29、所述控制器,用于基于大語言模型的模型結(jié)構(gòu)、以及數(shù)據(jù)處理系統(tǒng)中數(shù)據(jù)處理裝置的數(shù)量,將所述大語言模型劃分為多個處理塊,并為多個所述處理塊確定建立映射關(guān)系的數(shù)據(jù)處理裝置;以及,針對每個數(shù)據(jù)處理裝置,將與所述每個數(shù)據(jù)處理裝置關(guān)聯(lián)的處理塊的處理參數(shù),部署至所述每個數(shù)據(jù)處理裝置;

30、多個所述數(shù)據(jù)處理裝置中的每個數(shù)據(jù)處理裝置,用于執(zhí)行建立映射關(guān)系的處理塊的數(shù)據(jù)處理任務(wù)。

31、第三方面,本公開實施例還提供一種數(shù)據(jù)處理方法,包括:

32、利用數(shù)據(jù)輸入單元獲取大語言模型的目標(biāo)處理塊對應(yīng)的待處理數(shù)據(jù);所述大語言模型進包括:多個由注意力網(wǎng)絡(luò)、以及前饋神經(jīng)網(wǎng)絡(luò)構(gòu)成的網(wǎng)絡(luò)層;所述目標(biāo)處理塊包括下述至少一項:所述網(wǎng)絡(luò)層、所述注意力網(wǎng)絡(luò)、前饋神經(jīng)網(wǎng)絡(luò)、由所述注意力網(wǎng)絡(luò)劃分成的第一子網(wǎng)絡(luò)、以及由前饋神經(jīng)網(wǎng)絡(luò)劃分成的第二子網(wǎng)絡(luò);

33、利用多個處理單元中的每個處理單元,對所述待處理數(shù)據(jù)執(zhí)行與所述目標(biāo)處理塊的數(shù)據(jù)處理功能對應(yīng)的目標(biāo)處理,得到每個所述處理單元對應(yīng)的結(jié)果數(shù)據(jù);其中,不同所述處理單元對所述待處理數(shù)據(jù)進行所述目標(biāo)處理時使用的處理參數(shù)不同,處理方式相同;

34、利用合并單元對多個所述處理單元分別輸出的結(jié)果數(shù)據(jù)進行合并處理,得到與所述目標(biāo)處理塊對應(yīng)的目標(biāo)數(shù)據(jù)。

35、第四方面,本公開實施例還提供一種計算機設(shè)備,包括:如第一方面或第一方面任一項所述的數(shù)據(jù)處理裝置、或如第二方面所述的數(shù)據(jù)處理系統(tǒng)。

36、應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,而非限制本公開的技術(shù)方案。

37、本公開實施例提供的數(shù)據(jù)處理裝置,利用了大語言模型在結(jié)構(gòu)上面的一致性、以及構(gòu)成大語言模型的不同結(jié)構(gòu)之間數(shù)據(jù)傳輸量少所導(dǎo)致的不同模塊之間的弱耦合性,根據(jù)大語言模型的模型結(jié)構(gòu),將大語言模型的數(shù)據(jù)處理任務(wù)拆分為不同目標(biāo)處理塊,而針對每一個目標(biāo)處理塊,多個數(shù)據(jù)處理單元利用不同的可以實現(xiàn)利用不同的處理參數(shù),對目標(biāo)處理塊對應(yīng)的待處理數(shù)據(jù)執(zhí)行處理方式相同的目標(biāo)處理,得到各個處理單元對應(yīng)的結(jié)果數(shù)據(jù),然后利用合并單元將多個處理單元分別對應(yīng)的結(jié)果數(shù)據(jù)進行合并,從實現(xiàn)了將對相同數(shù)據(jù)的處理任務(wù)分配到多個不同的處理單元中完成,不同的處理單元在執(zhí)行對相同待處理數(shù)據(jù)的處理任務(wù)時,調(diào)用不同的處理參數(shù),進而可以在利用數(shù)據(jù)處理裝置處理數(shù)據(jù)處理任務(wù)之前,將各個處理單元所對應(yīng)的特定參數(shù)傳入到各個處理單元中。而在任務(wù)處理過程中,讀入的參數(shù)無需再更換或者重新傳入,從而減少了參數(shù)讀入過程所需要消耗的時間和資源,提升任務(wù)處理的效率。

38、為使本公開的上述目的、特征和優(yōu)點能更明顯易懂,下文特舉較佳實施例,并配合所附附圖,作詳細(xì)說明如下。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1