本申請涉及模型訓(xùn)練領(lǐng)域,尤其涉及一種用戶信用評價模型的數(shù)據(jù)處理方法和裝置。
背景技術(shù):
1、在用戶信用評價的場景中,用戶信用與多種用戶行為有關(guān)。在基于用戶信用的消費過程中,用戶購買的消費品、貸款方式、貸款利率、分期付款、信用行為時間等多方面因素都對該用戶的信用評價造成影響。僅通過固定的規(guī)則或人為判斷的方式顯然不能滿足用戶信用評價的需求。
2、分類模型可以快速準確地實現(xiàn)分類處理,廣泛應(yīng)用于多種場景中。而在用戶的信用評價場景中,不同分類的用戶數(shù)量相差較大,基于不平衡的數(shù)據(jù)樣本訓(xùn)練得到的分類模型的分類準確性較低。
3、如何提高用戶信用評價模型的分類準確性,是本申請實施例提供的方案所要解決的技術(shù)問題。
技術(shù)實現(xiàn)思路
1、本申請實施例的目的是提供一種用戶信用評價模型的數(shù)據(jù)處理方法和裝置,用以提高用戶信用評價模型的分類準確性。
2、第一方面,提供了一種用戶信用評價模型的數(shù)據(jù)處理方法,包括:
3、獲取通信系統(tǒng)中的多個通信用戶的用戶行為樣本和對應(yīng)的信用標簽,所述用戶行為樣本由通信用戶的消費行為信息生成,所述信用標簽表征對應(yīng)的通信用戶在所述通信系統(tǒng)中所屬的信用評價分類;
4、獲取目標信用評價分類中的目標通信用戶的通信行為信息,所述目標信用評價分類為所述通信系統(tǒng)中的信用評價分類的少數(shù)類;
5、基于所述目標通信用戶的用戶行為樣本和通信行為信息對所述目標信用評價分類構(gòu)建補充用戶樣本和對應(yīng)的補充信用標簽,得到各信用評價分類中用戶樣本數(shù)據(jù)平衡的多個用戶樣本和對應(yīng)的信用標簽,所述多個用戶樣本和對應(yīng)的信用標簽用于訓(xùn)練用戶信用評價模型。
6、第二方面,提供了一種用戶信用評價模型的數(shù)據(jù)處理裝置,包括:
7、第一獲取模塊,獲取通信系統(tǒng)中的多個通信用戶的用戶行為樣本和對應(yīng)的信用標簽,所述用戶行為樣本由通信用戶的消費行為信息生成,所述信用標簽表征對應(yīng)的通信用戶在所述通信系統(tǒng)中所屬的信用評價分類;
8、第二獲取模塊,獲取目標信用評價分類中的目標通信用戶的通信行為信息,所述目標信用評價分類為所述通信系統(tǒng)中的信用評價分類的少數(shù)類;
9、構(gòu)建模塊,基于所述目標通信用戶的用戶行為樣本和通信行為信息對所述目標信用評價分類構(gòu)建補充用戶樣本和對應(yīng)的補充信用標簽,得到各信用評價分類中用戶樣本數(shù)據(jù)平衡的多個用戶樣本和對應(yīng)的信用標簽,所述多個用戶樣本和對應(yīng)的信用標簽用于訓(xùn)練用戶信用評價模型。
10、第三方面,提供了一種電子設(shè)備,該電子設(shè)備包括處理器、存儲器及存儲在該存儲器上并可在該處理器上運行的計算機程序,該計算機程序被該處理器執(zhí)行時實現(xiàn)如第一方面的方法的步驟。
11、第四方面,提供了一種計算機可讀存儲介質(zhì),該計算機可讀存儲介質(zhì)上存儲計算機程序,該計算機程序被處理器執(zhí)行時實現(xiàn)如第一方面的方法的步驟。
12、第五方面,提供了一種計算機程序產(chǎn)品,該計算機程序產(chǎn)品包括存儲了計算機程序的非瞬時性計算機可讀存儲介質(zhì),該計算機程序可操作來使計算機執(zhí)行如第一方面的方法的部分或全部步驟。
13、在本申請實施例中,通過獲取通信系統(tǒng)中的多個通信用戶的用戶行為樣本和對應(yīng)的信用標簽,用戶行為樣本由通信用戶的消費行為信息生成,信用標簽表征對應(yīng)的通信用戶在通信系統(tǒng)中所屬的信用評價分類;獲取目標信用評價分類中的目標通信用戶的通信行為信息,目標信用評價分類為通信系統(tǒng)中的信用評價分類的少數(shù)類;基于目標通信用戶的用戶行為樣本和通信行為信息對目標信用評價分類構(gòu)建補充用戶樣本和對應(yīng)的補充信用標簽,得到各信用評價分類中用戶樣本數(shù)據(jù)平衡的多個用戶樣本和對應(yīng)的信用標簽,其中,多個用戶樣本和對應(yīng)的信用標簽用于訓(xùn)練用戶信用評價模型。本方案針對于通信系統(tǒng)中的信用評價分類的少數(shù)類的通信用戶獲取通信行為信息,并根據(jù)少數(shù)類的用戶行為樣本和通信行為信息構(gòu)建補充用戶樣本和對應(yīng)的補充信用標簽,能對少數(shù)類的樣本數(shù)量實現(xiàn)補充。而且,補充用戶樣本是基于真實用戶的行為信息構(gòu)建的,能真實體現(xiàn)出通信用戶的信用行為特征。各信用評價分類中用戶樣本數(shù)據(jù)平衡的多個用戶樣本和對應(yīng)的信用標簽可以用于訓(xùn)練用戶信用評價模型,從而能避免模型過擬合或欠擬合的情況,優(yōu)化用戶信用評價模型的效果。
1.一種用戶信用評價模型的數(shù)據(jù)處理方法,其特征在于,包括:
2.如權(quán)利要求1所述的方法,其特征在于,基于所述目標通信用戶的用戶行為樣本和通信行為信息對所述目標信用評價分類構(gòu)建補充用戶樣本和對應(yīng)的補充信用標簽,得到各信用評價分類中用戶樣本數(shù)據(jù)平衡的多個用戶樣本和對應(yīng)的信用標簽,包括:
3.如權(quán)利要求2所述的方法,其特征在于,所述通信行為信息包括通信行為畫像參數(shù);
4.如權(quán)利要求1所述的方法,其特征在于,獲取所述通信系統(tǒng)中的多個通信用戶的用戶行為樣本和對應(yīng)的信用標簽,包括:
5.如權(quán)利要求4所述的方法,其特征在于,在對多個通信用戶的用戶行為樣本執(zhí)行特征分布分析,得到所述用戶行為樣本的多維特征的分布結(jié)果之后,還包括:
6.如權(quán)利要求1所述的方法,其特征在于,在得到各信用評價分類中用戶樣本數(shù)據(jù)平衡的多個用戶樣本和對應(yīng)的信用標簽之后,所述方法還包括:
7.如權(quán)利要求6所述的方法,其特征在于,所述通信行為信息包括通信行為失信頻次和通信行為失信價值。
8.一種用戶信用評價模型的數(shù)據(jù)處理裝置,其特征在于,包括:
9.一種電子設(shè)備,其特征在于,包括:存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,所述計算機程序被所述處理器執(zhí)行時實現(xiàn)如權(quán)利要求1至7中任一項所述的方法的步驟。
10.一種計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1至7中任一項所述的方法的步驟。
11.一種計算機程序產(chǎn)品,其特征在于,所述計算機程序產(chǎn)品包括存儲了計算機程序的非瞬時性計算機可讀存儲介質(zhì),所述計算機程序可操作來使計算機執(zhí)行如權(quán)利要求1至7中任一項所述的方法的部分或全部步驟。