日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

欺詐預測模型訓練方法、裝置、設備、存儲介質及產品與流程

文檔序號:39726157發(fā)布日期:2024-10-22 13:25閱讀:2來源:國知局
欺詐預測模型訓練方法、裝置、設備、存儲介質及產品與流程

本技術涉及人工智能,尤其涉及一種欺詐預測模型訓練方法、裝置、設備、存儲介質及產品。


背景技術:

1、目前,對于金融業(yè)來說,防止客戶欺詐行為的發(fā)生(例如反洗錢等)任重而道遠,同時也需要大量且長期的工作,是銀行等金融部門所面臨的長期而艱巨的任務。

2、相關技術中,通過訓練完成欺詐預測模型的對客戶的行為(如交易行為)進行欺詐識別,以識別客戶行為是否為欺詐行為,對識別為欺詐的行為可通過預警、攔截交易等方式進行風險阻斷,防止客戶欺詐行為的發(fā)生。而一般欺詐預測模型的訓練,需要做大量的樣本標識,但由于欺詐行為的多樣性和隱蔽性,收集到的數(shù)據集中,相比標記為非欺詐行為的負樣本數(shù)據,標記為欺詐行為的正樣本數(shù)據的數(shù)據量較少,正負樣本比例不平衡。

3、一般而言可通過合成正訓練樣本的方式使得正負樣本比例均衡,但是傳統(tǒng)的樣本生成方法可能會生成偏離真實數(shù)據分布的合成樣本,導致無法有效地增強模型對少數(shù)類的識別能力,也即導致訓練出的欺詐預測模型無法準確識別欺詐行為。


技術實現(xiàn)思路

1、本技術的主要目的在于提供了一種欺詐預測模型訓練方法、裝置、設備、存儲介質及產品,旨在解決合成樣本偏離真實數(shù)據分布導致訓練出的欺詐預測模型無法準確識別欺詐行為的技術問題。

2、為實現(xiàn)上述目的,本技術提供了一種欺詐預測模型訓練方法,所述欺詐預測模型訓練方法包括以下步驟:

3、獲取訓練數(shù)據集,其中,所述訓練數(shù)據集包括正訓練樣本與負訓練樣本;

4、從所述正訓練樣本中選擇至少一個正訓練樣本作為目標正訓練樣本,基于所述目標正訓練樣本合成正訓練樣本,將合成的正訓練樣本作為合成訓練樣本,其中,所述合成訓練樣本與所述目標正訓練樣本的部分樣本特征的特征取值一致;

5、將所述合成訓練樣本添加至所述訓練數(shù)據集中得到目標訓練數(shù)據集,基于所述目標訓練數(shù)據集對預設的欺詐預測模型進行訓練。

6、可選地,所述基于所述目標正訓練樣本合成正訓練樣本的步驟,包括:

7、獲取所述訓練數(shù)據集中訓練樣本包括的各個樣本特征,設置各所述樣本特征的特征權重,其中,所述特征權重用于指示樣本特征對結果的影響程度,且特征權重越大對結果影響程度越大;

8、將各所述樣本特征中特征權重大于預設權重閾值的樣本特征作為第一樣本特征,將各所述樣本特征中特征權重小于或等于所述預設權重閾值的樣本特征作為第二樣本特征;

9、對于所述第一樣本特征,基于所述正訓練樣本確定第一樣本特征對應的取值空間;

10、對于所述第二樣本特征,將所述目標正訓練樣本在所述第二樣本特征下的特征取值作為所述第二樣本特征對應的取值空間;

11、基于各所述樣本特征的取值空間合成正訓練樣本,其中,合成的正訓練樣本的各樣本特征的特征取值在樣本特征對應的取值空間內。

12、可選地,所述基于所述正訓練樣本確定第一樣本特征對應的取值空間的步驟,包括:

13、確定所述正訓練樣本中的所有同型樣本,其中,各所述同型樣本為所述正訓練樣本中樣本相似度大于預設樣本相似度閾值的一對正訓練樣本;

14、將各對所述同型樣本在所有所述第一樣本特征下的特征分布空間作為所述第一樣本特征對應的取值空間。

15、可選地,各所述樣本特征包括差異維度樣本特征與非差異維度樣本特征,所述設置各所述樣本特征的特征權重的步驟,包括:

16、將預設平衡權重設置為所述非差異維度樣本特征的特征權重;

17、計算所述差異維度樣本特征的特征稀疏指數(shù),基于隨機森林特征選擇算法確定所述差異維度樣本特征的隨機權重,獲取所述差異維度樣本特征對應的相對權重,基于所述特征稀疏指數(shù)與所述相對權重調整所述隨機權重,將調整后的所述隨機權重設置為所述差異維度樣本特征的特征權重。

18、可選地,所述將合成的正訓練樣本作為合成訓練樣本的步驟之后,所述方法還包括:

19、確定所述合成訓練樣本與預設核心樣本之間的相似度,計算所述合成訓練樣本與所述預設核心樣本之間的總特征值差;

20、基于所述相似度與所述總特征值差確定權重更新因子,其中,所述權重更新因子與所述相似度正相關,所述權重更新因子與所述總特征值差負相關;

21、獲取所有樣本特征的當前特征權重,以所述權重更新因子調整所述當前特征權重,以基于調整后的所述當前特征權重合成正訓練樣本。

22、可選地,所述將合成的正訓練樣本作為合成訓練樣本的步驟之后,所述方法還包括:

23、將所述合成訓練樣本輸入至預設的隨機森林分類器中,輸出得到所述合成訓練樣本的置信度;

24、選擇所述合成訓練樣本中置信度大于預設置信度閾值的目標合成訓練樣本,基于所述目標合成訓練樣本執(zhí)行將合成的正訓練樣本作為合成訓練樣本的步驟。

25、可選地,所述預設的欺詐預測模型包括特征提取網絡與分類器網絡,所述基于所述目標訓練數(shù)據集對預設的欺詐預測模型進行訓練的步驟,包括:

26、基于所述目標訓練數(shù)據集對所述特征提取網絡進行訓練,得到訓練完成的特征提取網絡;

27、基于訓練完成的所述特征提取網絡對所述目標訓練數(shù)據集中的訓練樣本進行特征提取,得到樣本特征矩陣;

28、基于所述樣本特征矩陣對所述分類器網絡進行訓練。

29、可選地,所述分類器網絡包括隱藏層與輸出層,所述基于所述樣本特征矩陣對所述分類器網絡進行訓練的步驟,包括:

30、基于所述樣本特征矩陣對所述分類器進行迭代訓練;

31、在每次迭代訓練過程中,基于預設的蟻群算法更新所述隱藏層的權重,基于所述隱藏層的權重更新所述輸出層的權重;

32、直至達到預設的迭代終止條件后,退出迭代,得到訓練完成的分類器網絡。

33、此外,為實現(xiàn)上述目的,本技術還提出一種欺詐預測模型訓練裝置,所述欺詐預測模型訓練裝置包括:

34、獲取模塊,用于獲取訓練數(shù)據集,其中,所述訓練數(shù)據集包括正訓練樣本與負訓練樣本;

35、合成模塊,用于從所述正訓練樣本中選擇至少一個正訓練樣本作為目標正訓練樣本,基于所述目標正訓練樣本合成正訓練樣本,將合成的正訓練樣本作為合成訓練樣本,其中,所述合成訓練樣本與所述目標正訓練樣本的部分樣本特征的特征取值一致;

36、訓練模塊,用于將所述合成訓練樣本添加至所述訓練數(shù)據集中得到目標訓練數(shù)據集,基于所述目標訓練數(shù)據集對預設的欺詐預測模型進行訓練。

37、此外,為實現(xiàn)上述目的,本技術還提出一種欺詐預測模型訓練設備,所述設備包括:存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的欺詐預測模型訓練程序,所述欺詐預測模型訓練程序配置為實現(xiàn)如上文所述的欺詐預測模型訓練方法的步驟。

38、此外,為實現(xiàn)上述目的,本技術還提出一種可讀存儲介質,所述可讀存儲介質包括計算機可讀存儲介質,所述計算機可讀存儲介質上存儲有欺詐預測模型訓練程序,所述欺詐預測模型訓練程序被處理器執(zhí)行時實現(xiàn)如上文所述的欺詐預測模型訓練方法的步驟。

39、此外,為實現(xiàn)上述目的,本技術還提供一種計算機程序產品,所述計算機程序產品包括欺詐預測模型訓練程序,所述欺詐預測模型訓練程序被處理器執(zhí)行時實現(xiàn)如上文所述的欺詐預測模型訓練方法的步驟。

40、本技術獲取訓練數(shù)據集,其中,所述訓練數(shù)據集包括正訓練樣本與負訓練樣本;從所述正訓練樣本中選擇至少一個正訓練樣本作為目標正訓練樣本,基于所述目標正訓練樣本合成正訓練樣本,將合成的正訓練樣本作為合成訓練樣本,其中,所述合成訓練樣本與所述目標正訓練樣本的部分樣本特征的特征取值一致;將所述合成訓練樣本添加至所述訓練數(shù)據集中得到目標訓練數(shù)據集,基于所述目標訓練數(shù)據集對預設的欺詐預測模型進行訓練。如此,本技術實施例基于至少一個目標正訓練樣本合成正訓練樣本,合成訓練樣本與目標合成訓練樣本存在特征取值保持一致的部分樣本特征,通過部分樣本特征的取值與目標合成訓練樣本保持一致,從而使得合成的正訓練樣本靠近目標正訓練樣本分布,進而保證合成的正訓練樣本靠近原始的真實正訓練樣本分布,避免了合成樣本偏離真實數(shù)據分布的現(xiàn)象,再以增加了合訓練樣本的目標訓練集對預設的欺詐預測模型進行訓練,使得欺詐預測模型對少數(shù)類具有較好的識別效果,從而提高了訓練完成的欺詐預測模型對欺詐行為識別的準確度。

當前第1頁1 2 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1