本發(fā)明涉及數(shù)據(jù)溯源,尤其是涉及一種數(shù)據(jù)溯源方法、裝置、溯源服務(wù)器、集群溯源設(shè)備及介質(zhì)。
背景技術(shù):
1、算力網(wǎng)絡(luò)通過(guò)連接多源泛在計(jì)算資源,能夠提供高效、便捷的計(jì)算服務(wù)。由于計(jì)算節(jié)點(diǎn)的廣泛接入,其位置、計(jì)算能力、可信性等均不相同。在開展計(jì)算服務(wù)的過(guò)程中,需要通過(guò)編排管理能力進(jìn)行調(diào)度,配合完成計(jì)算服務(wù),這就使得數(shù)據(jù)在計(jì)算過(guò)程中要進(jìn)行流轉(zhuǎn)。為了保障算力服務(wù)的可靠可信,對(duì)數(shù)據(jù)在算網(wǎng)流轉(zhuǎn)過(guò)程進(jìn)行溯源是提供給用戶數(shù)據(jù)合法使用的重要證據(jù)。
2、目前已有通過(guò)日志分析或流量解析進(jìn)行數(shù)據(jù)溯源的技術(shù)方案,但這些方案在算力網(wǎng)絡(luò)場(chǎng)景下使用具有較大的限制性,難以實(shí)現(xiàn)算力網(wǎng)絡(luò)中的數(shù)據(jù)溯源。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的在于提供一種數(shù)據(jù)溯源方法、裝置、溯源服務(wù)器、集群溯源設(shè)備及介質(zhì),用于解決現(xiàn)有數(shù)據(jù)溯源方案難以實(shí)現(xiàn)算力網(wǎng)絡(luò)中的數(shù)據(jù)溯源的問(wèn)題。
2、為了達(dá)到上述目的,第一方面,本發(fā)明實(shí)施例提供一種數(shù)據(jù)溯源方法,應(yīng)用于溯源服務(wù)器,包括:
3、獲取n個(gè)集群溯源設(shè)備上報(bào)的m個(gè)溯源記錄;其中,所述集群溯源設(shè)備部署于數(shù)據(jù)處理集群側(cè),每個(gè)所述集群溯源設(shè)備對(duì)應(yīng)一個(gè)數(shù)據(jù)處理集群,所述溯源記錄包括第一校驗(yàn)信息和第二校驗(yàn)信息,所述第一校驗(yàn)信息是根據(jù)第一溯源記錄生成元對(duì)第一數(shù)據(jù)生成的,所述第二校驗(yàn)信息是根據(jù)第二溯源記錄生成元對(duì)第二數(shù)據(jù)生成的,所述第一數(shù)據(jù)和所述第二數(shù)據(jù)是預(yù)設(shè)處理前后的數(shù)據(jù),m≥n,且m、n為正整數(shù);
4、根據(jù)所述m個(gè)溯源記錄,獲得目標(biāo)用戶數(shù)據(jù)在算力網(wǎng)絡(luò)中流轉(zhuǎn)的全流程溯源。
5、在一些實(shí)施例中,所述根據(jù)所述m個(gè)溯源記錄,獲得目標(biāo)用戶數(shù)據(jù)在算力網(wǎng)絡(luò)中流轉(zhuǎn)的全流程溯源,包括:
6、在接收到針對(duì)所述目標(biāo)用戶數(shù)據(jù)的溯源請(qǐng)求的情況下,確定第一溯源記錄,所述第一溯源記錄為所述目標(biāo)用戶數(shù)據(jù)對(duì)應(yīng)的溯源記錄;
7、根據(jù)所述第一溯源記錄以及所述m個(gè)溯源記錄中除所述第一溯源記錄之外的其他溯源記錄,確定出所述目標(biāo)用戶數(shù)據(jù)由第一跳至最后一跳的溯源記錄;
8、將所述目標(biāo)用戶數(shù)據(jù)對(duì)應(yīng)的溯源記錄、所述目標(biāo)用戶數(shù)據(jù)由第一跳至最后一跳的溯源記錄確定為所述目標(biāo)用戶數(shù)據(jù)在算力網(wǎng)絡(luò)中流轉(zhuǎn)的全流程溯源。
9、在一些實(shí)施例中,根據(jù)所述第一溯源記錄以及所述m個(gè)溯源記錄中除所述第一溯源記錄之外的其他溯源記錄,確定出所述目標(biāo)用戶數(shù)據(jù)由第一跳至最后一跳的溯源記錄,包括:
10、在根據(jù)第一計(jì)算結(jié)果,所述第一計(jì)算結(jié)果是由所述第一溯源記錄中的第二校驗(yàn)信息與第二溯源記錄中的第一校驗(yàn)信息執(zhí)行雙線性對(duì)計(jì)算得到的,對(duì)所述第一溯源記錄中已加密的溯源信息成功解密的情況下,確定所述第二溯源記錄為所述目標(biāo)用戶數(shù)據(jù)第一跳的溯源記錄;
11、在根據(jù)第二計(jì)算結(jié)果,所述第二計(jì)算結(jié)果是由所述第二溯源記錄中的第二校驗(yàn)信息與第三溯源記錄中的第一校驗(yàn)信息執(zhí)行雙線性對(duì)計(jì)算得到的,對(duì)所述第二溯源記錄中已加密的溯源信息成功解密的情況下,確定所述第三溯源記錄為所述目標(biāo)用戶數(shù)據(jù)第二跳的溯源記錄,直至確定出目標(biāo)溯源記錄,所述目標(biāo)溯源記錄為所述目標(biāo)用戶數(shù)據(jù)最后一跳的溯源記錄,所述目標(biāo)溯源記錄中的第二校驗(yàn)信息為零;其中,所述第二溯源記錄、所述第三溯源記錄和所述目標(biāo)溯源記錄均為所述m個(gè)溯源記錄中的一者。
12、在一些實(shí)施例中,所述確定第一溯源記錄,包括:
13、利用第一對(duì)稱加密密鑰,對(duì)所述m個(gè)溯源記錄中的溯源記錄進(jìn)行解密;
14、將從中解密出所述目標(biāo)用戶數(shù)據(jù)的溯源記錄確定為所述第一溯源記錄。
15、在一些實(shí)施例中,所述方法還包括:
16、獲取所述n個(gè)集群溯源設(shè)備上報(bào)的m個(gè)日志校驗(yàn)信息;
17、在確定第一日志文件需要驗(yàn)證的情況下,根據(jù)所述第一日志文件,獲得第一校驗(yàn)值,并根據(jù)所述第一校驗(yàn)值和日志驗(yàn)證生成元,計(jì)算得到第一密鑰;
18、利用所述第一密鑰,對(duì)第一日志校驗(yàn)信息進(jìn)行解密,獲得解密結(jié)果;其中,所述第一日志校驗(yàn)信息為所述m個(gè)日志校驗(yàn)信息中與所述第一日志文件對(duì)應(yīng)的日志校驗(yàn)信息;
19、在所述解密結(jié)果表征解密失敗的情況下,確定所述第一日志文件對(duì)應(yīng)的溯源記錄不可信;
20、在所述解密結(jié)果是第一特征向量,且所述第一特征向量與第一日志文件中的特征值不同的情況下,確定所述第一日志文件對(duì)應(yīng)的溯源記錄不可信;
21、在所述解密結(jié)果是第一特征向量,且所述第一特征向量與第一日志文件中的特征值相同的情況下,確定所述第一日志文件對(duì)應(yīng)的溯源記錄可信。
22、在一些實(shí)施例中,所述方法還包括:
23、按照所述目標(biāo)用戶數(shù)據(jù)在數(shù)據(jù)處理集群間的流轉(zhuǎn)順序,向k個(gè)集群溯源設(shè)備中的每個(gè)所述集群溯源設(shè)備發(fā)送第一溯源記錄生成元和第二溯源記錄生成元;
24、其中,所述第一溯源記錄生成元和所述第二溯源記錄生成元均用于生成所述溯源記錄,且按照所述流轉(zhuǎn)順序,第i個(gè)所述集群溯源設(shè)備獲得的所述第二溯源生成元與第i+1個(gè)所述集群溯源設(shè)備獲得的所述第一溯源生成元相同,所述k個(gè)集群溯源設(shè)備包括參與所述目標(biāo)用戶數(shù)據(jù)的計(jì)算任務(wù)的k個(gè)數(shù)據(jù)處理集群側(cè)各自部署的集群溯源設(shè)備,k,i均為正整數(shù)。
25、在一些實(shí)施例中,所述方法還包括:
26、向k個(gè)集群溯源設(shè)備中的每個(gè)所述集群溯源設(shè)備發(fā)送日志驗(yàn)證生成元;其中,所述日志驗(yàn)證生成元用于生成日志文件的第二對(duì)稱加密密鑰,所述第二對(duì)稱加密密鑰用于加密所述日志文件對(duì)應(yīng)的特征向量。
27、第二方面,本發(fā)明實(shí)施例還提供一種數(shù)據(jù)溯源方法,應(yīng)用于集群溯源設(shè)備,包括:
28、獲取數(shù)據(jù)處理集群的日志文件;其中,所述日志文件用于記錄與第一數(shù)據(jù)的計(jì)算處理相關(guān)的信息;所述集群溯源設(shè)備部署于所述數(shù)據(jù)處理集群側(cè);
29、根據(jù)所述日志文件、第一溯源記錄生成元和第二溯源記錄生成元,獲得溯源記錄;其中,所述溯源記錄包括第一校驗(yàn)信息和第二校驗(yàn)信息,所述第一校驗(yàn)信息是根據(jù)所述第一溯源記錄生成元對(duì)所述第一數(shù)據(jù)生成的,所述第二校驗(yàn)信息是根據(jù)所述第二溯源記錄生成元對(duì)第二數(shù)據(jù)生成的,所述第一數(shù)據(jù)和所述第二數(shù)據(jù)是預(yù)設(shè)處理前后的數(shù)據(jù);
30、向溯源服務(wù)器上報(bào)所述溯源記錄。
31、在一些實(shí)施例中,所述獲取數(shù)據(jù)處理集群的日志文件,包括:
32、提取所述數(shù)據(jù)處理集群內(nèi)參與所述第一數(shù)據(jù)的計(jì)算處理的各算力節(jié)點(diǎn)的日志記錄;
33、根據(jù)所述參與所述第一數(shù)據(jù)的計(jì)算處理的各算力節(jié)點(diǎn)的日志記錄,獲得原始日志文件;
34、對(duì)所述原始日志文件進(jìn)行日志清洗,獲得日志清洗后的日志文件。
35、在一些實(shí)施例中,所述根據(jù)所述日志文件、第一溯源記錄生成元和第二溯源記錄生成元,獲得溯源記錄,包括:
36、從所述日志文件中提取溯源信息;
37、根據(jù)所述第一數(shù)據(jù)和所述第一溯源記錄生成元,生成所述第一校驗(yàn)信息;
38、根據(jù)所述第二數(shù)據(jù)和所述第二溯源記錄生成元,生成所述第二校驗(yàn)信息,所述第二數(shù)據(jù)為所述第一數(shù)據(jù)經(jīng)數(shù)據(jù)處理后的數(shù)據(jù);
39、利用第二密鑰加密所述溯源信息,得到已加密的溯源信息,所述第二密鑰基于所述第二溯源記錄生成元獲得;
40、獲得所述溯源記錄,所述溯源記錄包括所述已加密的溯源信息、所述第一校驗(yàn)信息和所述第二校驗(yàn)信息。
41、在一些實(shí)施例中,所述方法還包括:
42、在所述第一數(shù)據(jù)為目標(biāo)用戶數(shù)據(jù)的情況下,利用第一對(duì)稱加密密鑰,對(duì)所述目標(biāo)用戶數(shù)據(jù)進(jìn)行加密,獲得加密后的數(shù)據(jù),所述溯源記錄還包括所述加密后的數(shù)據(jù)。
43、在一些實(shí)施例中,所述方法還包括:
44、接收所述溯源服務(wù)器發(fā)送的所述第一溯源記錄生成元和所述第二溯源記錄生成元。
45、在一些實(shí)施例中,所述方法還包括:
46、提取所述日志文件的特征值;
47、根據(jù)所述日志文件的特征值,獲得特征向量;
48、基于日志驗(yàn)證生成元,生成所述日志文件的第二對(duì)稱加密密鑰;
49、利用所述第二對(duì)稱加密密鑰加密所述特征向量,獲得日志校驗(yàn)信息。
50、在一些實(shí)施例中,所述方法還包括:
51、接收所述溯源服務(wù)器發(fā)送的所述日志驗(yàn)證生成元。
52、第三方面,本發(fā)明實(shí)施例還提供一種數(shù)據(jù)溯源裝置,應(yīng)用于溯源服務(wù)器,包括:
53、第一獲取模塊,用于獲取n個(gè)集群溯源設(shè)備上報(bào)的m個(gè)溯源記錄;其中,所述集群溯源設(shè)備部署于數(shù)據(jù)處理集群側(cè),每個(gè)所述集群溯源設(shè)備對(duì)應(yīng)一個(gè)數(shù)據(jù)處理集群,所述溯源記錄包括第一校驗(yàn)信息和第二校驗(yàn)信息,所述第一校驗(yàn)信息是根據(jù)第一溯源記錄生成元對(duì)第一數(shù)據(jù)生成的,所述第二校驗(yàn)信息是根據(jù)第二溯源記錄生成元對(duì)第二數(shù)據(jù)生成的,所述第一數(shù)據(jù)和所述第二數(shù)據(jù)是預(yù)設(shè)處理前后的數(shù)據(jù),m≥n,且m、n為正整數(shù);
54、溯源處理模塊,用于根據(jù)所述m個(gè)溯源記錄,獲得目標(biāo)用戶數(shù)據(jù)在算力網(wǎng)絡(luò)中流轉(zhuǎn)的全流程溯源。
55、第四方面,本發(fā)明實(shí)施例還提供一種溯源服務(wù)器,包括處理器和收發(fā)器,所述收發(fā)器在處理器的控制下接收和發(fā)送數(shù)據(jù),所述處理器用于執(zhí)行以下操作:
56、獲取n個(gè)集群溯源設(shè)備上報(bào)的m個(gè)溯源記錄;其中,所述集群溯源設(shè)備部署于數(shù)據(jù)處理集群側(cè),每個(gè)所述集群溯源設(shè)備對(duì)應(yīng)一個(gè)數(shù)據(jù)處理集群,所述溯源記錄包括第一校驗(yàn)信息和第二校驗(yàn)信息,所述第一校驗(yàn)信息是根據(jù)第一溯源記錄生成元對(duì)第一數(shù)據(jù)生成的,所述第二校驗(yàn)信息是根據(jù)第二溯源記錄生成元對(duì)第二數(shù)據(jù)生成的,所述第一數(shù)據(jù)和所述第二數(shù)據(jù)是預(yù)設(shè)處理前后的數(shù)據(jù),m≥n,且m、n為正整數(shù);
57、根據(jù)所述m個(gè)溯源記錄,獲得目標(biāo)用戶數(shù)據(jù)在算力網(wǎng)絡(luò)中流轉(zhuǎn)的全流程溯源。
58、第五方面,本發(fā)明實(shí)施例還提供一種溯源服務(wù)器,包括存儲(chǔ)器、處理器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的程序;所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)如上述第一方面所述的數(shù)據(jù)溯源方法。
59、第六方面,本發(fā)明實(shí)施例還提供一種數(shù)據(jù)溯源裝置,應(yīng)用于集群溯源設(shè)備,包括:
60、第二獲取模塊,用于獲取數(shù)據(jù)處理集群的日志文件;其中,所述日志文件用于記錄與第一數(shù)據(jù)的計(jì)算處理相關(guān)的信息;所述集群溯源設(shè)備部署于所述數(shù)據(jù)處理集群側(cè);
61、第一處理模塊,用于根據(jù)所述日志文件、第一溯源記錄生成元和第二溯源記錄生成元,獲得溯源記錄;其中,所述溯源記錄包括第一校驗(yàn)信息和第二校驗(yàn)信息,所述第一校驗(yàn)信息是根據(jù)所述第一溯源記錄生成元對(duì)所述第一數(shù)據(jù)生成的,所述第二校驗(yàn)信息是根據(jù)所述第二溯源記錄生成元對(duì)第二數(shù)據(jù)生成的,所述第一數(shù)據(jù)和所述第二數(shù)據(jù)是預(yù)設(shè)處理前后的數(shù)據(jù);
62、第一發(fā)送模塊,用于向溯源服務(wù)器上報(bào)所述溯源記錄。
63、第七方面,本發(fā)明實(shí)施例還提供一種集群溯源設(shè)備,包括處理器和收發(fā)器,所述收發(fā)器在處理器的控制下接收和發(fā)送數(shù)據(jù),所述處理器用于執(zhí)行以下操作:
64、獲取數(shù)據(jù)處理集群的日志文件;其中,所述日志文件用于記錄與第一數(shù)據(jù)的計(jì)算處理相關(guān)的信息;所述集群溯源設(shè)備部署于所述數(shù)據(jù)處理集群側(cè);
65、根據(jù)所述日志文件、第一溯源記錄生成元和第二溯源記錄生成元,獲得溯源記錄;其中,所述溯源記錄包括第一校驗(yàn)信息和第二校驗(yàn)信息,所述第一校驗(yàn)信息是根據(jù)所述第一溯源記錄生成元對(duì)所述第一數(shù)據(jù)生成的,所述第二校驗(yàn)信息是根據(jù)所述第二溯源記錄生成元對(duì)第二數(shù)據(jù)生成的,所述第一數(shù)據(jù)和所述第二數(shù)據(jù)是預(yù)設(shè)處理前后的數(shù)據(jù);
66、向溯源服務(wù)器上報(bào)所述溯源記錄。
67、第八方面,本發(fā)明實(shí)施例還提供一種集群溯源設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的程序;所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)如上述第二方面所述的數(shù)據(jù)溯源方法。
68、第九方面,本發(fā)明實(shí)施例還提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述第一方面所述的數(shù)據(jù)溯源方法中的步驟,或者實(shí)現(xiàn)如上述第二方面所述的數(shù)據(jù)溯源方法中的步驟。
69、第十方面,本發(fā)明實(shí)施例還提供一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)指令,所述計(jì)算機(jī)指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述第一方面所述的數(shù)據(jù)溯源方法中的步驟,或者實(shí)現(xiàn)如上述第二方面所述的數(shù)據(jù)溯源方法中的步驟。
70、本發(fā)明的上述技術(shù)方案至少具有如下有益效果:
71、本發(fā)明實(shí)施例中,通過(guò)獲取n個(gè)集群溯源設(shè)備上報(bào)的m個(gè)溯源記錄;其中,所述集群溯源設(shè)備部署于數(shù)據(jù)處理集群側(cè),每個(gè)所述集群溯源設(shè)備對(duì)應(yīng)一個(gè)數(shù)據(jù)處理集群,所述溯源記錄包括第一校驗(yàn)信息和第二校驗(yàn)信息,所述第一校驗(yàn)信息是根據(jù)第一溯源記錄生成元對(duì)第一數(shù)據(jù)生成的,所述第二校驗(yàn)信息是根據(jù)第二溯源記錄生成元對(duì)第二數(shù)據(jù)生成的,所述第一數(shù)據(jù)和所述第二數(shù)據(jù)是預(yù)設(shè)處理前后的數(shù)據(jù),m≥n,且m、n為正整數(shù);根據(jù)所述m個(gè)溯源記錄,獲得目標(biāo)用戶數(shù)據(jù)在算力網(wǎng)絡(luò)中流轉(zhuǎn)的全流程溯源,即利用溯源記錄中生成校驗(yàn)信息的溯源記錄生成元的雙線性性,通過(guò)雙線性配對(duì)獲得目標(biāo)用戶數(shù)據(jù)在算力網(wǎng)絡(luò)中流轉(zhuǎn)的全流程溯源,這樣,通過(guò)上述處理,實(shí)現(xiàn)了算力網(wǎng)絡(luò)中跨數(shù)據(jù)處理集群的數(shù)據(jù)溯源。