本申請涉及人工智能,尤其涉及一種基于工單的數(shù)據(jù)處理方法、裝置及計算機程序產(chǎn)品。
背景技術:
1、隨著人工智能技術的蓬勃發(fā)展,基于自然語言處理的深度學習模型得到了廣泛的應用。在通信領域,ip承載網(wǎng)的工單需要人工進行審核。為此,通過深度學習模型從口語化描述的工單中提煉有用信息,以輔助技術人員進行分析和決策,就顯得尤為重要。
2、然而,因通信業(yè)務自身特點,運營方所掌握的ip承載網(wǎng)的工單樣本十分匱乏(特別是已標注樣本),在低資源條件下,如何有效訓練出提取工單信息的深度學習模型是本申請所要解決的技術問題。
技術實現(xiàn)思路
1、本申請目的是提供一種基于工單的數(shù)據(jù)處理方法、裝置及計算機程序產(chǎn)品,能夠在原始工單樣本匱乏的情況下,有效訓練出可提取工單信息的深度學習模型。
2、為了實現(xiàn)上述目的,本申請實施例是這樣實現(xiàn)的:
3、第一方面,提供一種基于工單的數(shù)據(jù)處理方法,包括:
4、確定原始工單集中每個原始工單的軟提示詞;
5、基于大語言模型,對每個所述原始工單的軟提示詞進行自編碼訓練;
6、以每個所述原始工單的訓練后的軟提示詞為參數(shù),對每個所述原始工單進行數(shù)據(jù)集增強,得到增強工單集;
7、基于所述增強工單集,訓練用于從工單中提取工單信息的目標深度學習模型。
8、第二方面,提供一種基于工單的數(shù)據(jù)處理裝置,還包括:
9、軟提示詞確定模塊,用于確定原始工單集中每個原始工單的軟提示詞;
10、第一訓練模塊,用于基于大語言模型,對每個所述原始工單的軟提示詞進行自編碼訓練;
11、數(shù)據(jù)增強模塊,用于以每個所述原始工單的訓練后的軟提示詞為參數(shù),對每個所述原始工單進行數(shù)據(jù)集增強,得到增強工單集;
12、第二訓練模塊,用于基于所述增強工單集,訓練用于從工單中提取工單信息的目標深度學習模型。
13、第三方面,提供一種電子設備,包括:處理器;以及被安排成存儲計算機可執(zhí)行指令的存儲器,所述可執(zhí)行指令在被執(zhí)行時使所述處理器執(zhí)行以下操作:
14、確定原始工單集中每個原始工單的軟提示詞;
15、基于大語言模型,對每個所述原始工單的軟提示詞進行自編碼訓練;
16、以每個所述原始工單的訓練后的軟提示詞為參數(shù),對每個所述原始工單進行數(shù)據(jù)集增強,得到增強工單集;
17、基于所述增強工單集,訓練用于從工單中提取工單信息的目標深度學習模型。
18、第四方面,提供一種計算機可讀存儲介質,所述計算機可讀存儲介質用于存儲計算機可執(zhí)行指令,所述計算機可執(zhí)行指令在被處理器執(zhí)行時實現(xiàn)第一方面所述的方法。
19、本申請借助大語言模型對原始工單集中每個原始工單的軟提示詞進行自編碼訓練,以找出各原始工單相對適合的軟提示詞;之后,以原始工單訓練后的軟提示詞為參數(shù),對每個原始工單進行數(shù)據(jù)集增強,從而得到擴展的增強工單集,并最終基于增強工單集訓練用于從工單中提取工單信息的目標深度學習模型。整個方案能夠在原始工單樣本匱乏的情況下,有效擴展額外的增強工單以支撐模型訓練。
1.一種基于工單的數(shù)據(jù)處理方法,其特征在于,包括:
2.根據(jù)權利要求1所述的方法,其特征在于,
3.根據(jù)權利要求1所述的方法,其特征在于,
4.根據(jù)權利要求3所述的方法,其特征在于,
5.根據(jù)權利要求1所述的方法,其特征在于,
6.根據(jù)權利要求1所述的方法,其特征在于,
7.根據(jù)權利要求1至6中任一項所述的方法,其特征在于,
8.一種基于工單的數(shù)據(jù)處理裝置,其特征在于,還包括:
9.一種電子設備,包括:處理器;以及被安排成存儲計算機可執(zhí)行指令的存儲器,其特征在于,所述可執(zhí)行指令在被執(zhí)行時使所述處理器執(zhí)行以下操作:
10.一種計算機程序產(chǎn)品,所述計算機程序產(chǎn)品包括存儲了計算機程序的計算機可讀存儲介質,其特征在于,所述計算機程序可操作來使計算機執(zhí)行如下操作: