日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

可用判定規(guī)則挖掘方法、系統(tǒng)、設(shè)備及介質(zhì)與流程

文檔序號:39329340發(fā)布日期:2024-09-10 11:35閱讀:14來源:國知局
可用判定規(guī)則挖掘方法、系統(tǒng)、設(shè)備及介質(zhì)與流程

本技術(shù)涉及數(shù)據(jù)處理領(lǐng)域,特別涉及一種可用判定規(guī)則挖掘方法、系統(tǒng)、設(shè)備及介質(zhì)。


背景技術(shù):

1、隨著網(wǎng)約車的普及,在出行方便的同時(shí)開始出現(xiàn)了一些司乘勾結(jié)以套取網(wǎng)約車平臺(tái)補(bǔ)貼的虛假訂單,給平臺(tái)帶來了較大的損失。

2、現(xiàn)有技術(shù)主要針對虛假訂單的判定,通常是通過人為開發(fā)的一系列特征與設(shè)定好的閾值進(jìn)行比較以判定當(dāng)前訂單是否是虛假訂單;但人工判定總是會(huì)具有局限性,且判定準(zhǔn)確率低。

3、因此,亟需一種可用于判定虛假訂單的可用判定規(guī)則挖掘方法以解決上述技術(shù)問題。


技術(shù)實(shí)現(xiàn)思路

1、基于此,有必要針對上述技術(shù)問題,提供一種可用判定規(guī)則挖掘方法,以解決上述技術(shù)問題。

2、第一方面,本技術(shù)提供一種可用判定規(guī)則挖掘方法,所述方法包括:

3、根據(jù)預(yù)設(shè)規(guī)則在歷史樣本中選取第一目標(biāo)樣本,并對所述第一目標(biāo)樣本進(jìn)行打標(biāo);

4、隨機(jī)選取判定樣本為第二目標(biāo)樣本并對所述第二目標(biāo)樣本進(jìn)行打標(biāo);

5、為所述第一目標(biāo)樣本和第二目標(biāo)樣本分配樣本權(quán)重值,并根據(jù)所述樣本權(quán)重值生成權(quán)重評價(jià)函數(shù);

6、根據(jù)所述第一目標(biāo)樣本、第二目標(biāo)樣本以及權(quán)重評價(jià)函數(shù)對第一決策樹進(jìn)行訓(xùn)練;

7、選取所述第一決策樹中符合預(yù)設(shè)條件的目標(biāo)決策樹分支對應(yīng)的判定規(guī)則為可用判定規(guī)則。

8、在一些實(shí)施例中,所述權(quán)重評價(jià)函數(shù)為:其中,d表示第一決策樹中一個(gè)葉節(jié)點(diǎn)上的樣本集,k表示樣本類別,包括第一目標(biāo)樣本和第二目標(biāo)樣本兩類樣本,c'k表示第k類別樣本的權(quán)重值求和。

9、在一些實(shí)施例中,所述根據(jù)預(yù)設(shè)規(guī)則在歷史樣本中選取第一目標(biāo)樣本包括:

10、隨機(jī)選取歷史樣本中未被判定的歷史樣本作為待定樣本;

11、利用多個(gè)已訓(xùn)練好的第二決策樹分別對所述待定樣本進(jìn)行0、1預(yù)測;

12、計(jì)算每一所述待定樣本的預(yù)測為1的預(yù)測概率值;

13、根據(jù)所述預(yù)測概率值從高到低選取預(yù)設(shè)數(shù)量的待定樣本作為第一目標(biāo)樣本。

14、在一些實(shí)施例中,所述為所述第一目標(biāo)樣本和第二目標(biāo)樣本分配樣本權(quán)重值,包括:

15、根據(jù)所述待定樣本被所述第二決策樹的預(yù)測總次數(shù)與被所述第二決策樹預(yù)測為1的次數(shù)的比值,確定所述待定樣本的預(yù)測概率值;

16、將所述待定樣本的預(yù)測概率值作為所述待定樣本對應(yīng)的所述第一目標(biāo)樣本的樣本權(quán)重值;

17、為所述第二目標(biāo)樣本分配樣本權(quán)重值1。

18、在一些實(shí)施例中,所述根據(jù)所述第一目標(biāo)樣本、第二目標(biāo)樣本以及權(quán)重評價(jià)函數(shù)對第一決策樹進(jìn)行訓(xùn)練,包括:

19、對所述第一目標(biāo)樣本和第二目標(biāo)樣本開發(fā)樣本特征;

20、根據(jù)分裂策略對所有所述樣本特征中的可分裂點(diǎn)進(jìn)行分裂直至滿足分裂停止條件,其中,所述分裂策略包括:

21、計(jì)算各分裂點(diǎn)的權(quán)重評價(jià)函數(shù)值;

22、選取各分裂點(diǎn)中權(quán)重評價(jià)函數(shù)值最小的分裂點(diǎn)進(jìn)行分裂。

23、在一些實(shí)施例中,所述選取所述第一決策樹中符合預(yù)設(shè)條件的目標(biāo)決策樹分支對應(yīng)的判定規(guī)則為可用判定規(guī)則,包括:

24、選取所述第一決策樹中預(yù)測準(zhǔn)確率大于第一預(yù)設(shè)閾值且打標(biāo)為1的目標(biāo)決策樹分支;

25、修剪所述第一決策樹中除所述目標(biāo)決策樹分支外的決策樹分支以生成目標(biāo)決策樹;

26、利用所述目標(biāo)決策樹對新的預(yù)設(shè)時(shí)間段內(nèi)的數(shù)據(jù)樣本進(jìn)行預(yù)測;

27、比較所述目標(biāo)決策樹的預(yù)測準(zhǔn)確率是否大于等于第一預(yù)設(shè)閾值;

28、若所述目標(biāo)決策樹的預(yù)測準(zhǔn)確率大于等于第一預(yù)設(shè)閾值,則確定所述目標(biāo)決策樹分支對應(yīng)的判定規(guī)則為可用判定規(guī)則。

29、在一些實(shí)施例中,所述方法還包括第二決策樹的訓(xùn)練過程:

30、隨機(jī)選取判定樣本并作為訓(xùn)練樣本及驗(yàn)證樣本,并對所述訓(xùn)練樣本進(jìn)行打標(biāo);

31、對所述訓(xùn)練樣本開發(fā)多組樣本特征,利用多組所述樣本特征分別訓(xùn)練多個(gè)所述第二決策樹;

32、根據(jù)所述驗(yàn)證樣本驗(yàn)證所述第二決策樹的預(yù)測準(zhǔn)確率;

33、若所述預(yù)測準(zhǔn)確率大于等于第二預(yù)設(shè)閾值,則所述第二決策樹訓(xùn)練成功。

34、第二方面,本技術(shù)提供一種可用判定規(guī)則挖掘系統(tǒng),所述系統(tǒng)包括:

35、樣本處理模塊,用于根據(jù)預(yù)設(shè)規(guī)則在歷史樣本中選取第一目標(biāo)樣本,并對所述第一目標(biāo)樣本進(jìn)行打標(biāo);

36、所述樣本處理模塊,還用于隨機(jī)選取判定樣本為第二目標(biāo)樣本并對所述第二目標(biāo)樣本進(jìn)行打標(biāo);

37、數(shù)據(jù)處理模塊,用于為所述第一目標(biāo)樣本和第二目標(biāo)樣本分配樣本權(quán)重值,并根據(jù)所述樣本權(quán)重值生成權(quán)重評價(jià)函數(shù);

38、所述數(shù)據(jù)處理模塊,還用于根據(jù)所述第一目標(biāo)樣本、第二目標(biāo)樣本以及權(quán)重評價(jià)函數(shù)對第一決策樹進(jìn)行訓(xùn)練;

39、規(guī)則挖掘模塊,用于選取所述第一決策樹中符合預(yù)設(shè)條件的目標(biāo)決策樹分支對應(yīng)的判定規(guī)則為可用判定規(guī)則。

40、第三方面,本技術(shù)提供了一種電子設(shè)備,所述電子設(shè)備包括:

41、一個(gè)或多個(gè)處理器;

42、以及與所述一個(gè)或多個(gè)處理器關(guān)聯(lián)的存儲(chǔ)器,所述存儲(chǔ)器用于存儲(chǔ)程序指令,所述程序指令在被所述一個(gè)或多個(gè)處理器讀取執(zhí)行時(shí),執(zhí)行如下操作:

43、根據(jù)預(yù)設(shè)規(guī)則在歷史樣本中選取第一目標(biāo)樣本,并對所述第一目標(biāo)樣本進(jìn)行打標(biāo);

44、隨機(jī)選取判定樣本為第二目標(biāo)樣本并對所述第二目標(biāo)樣本進(jìn)行打標(biāo);

45、為所述第一目標(biāo)樣本和第二目標(biāo)樣本分配樣本權(quán)重值,并根據(jù)所述樣本權(quán)重值生成權(quán)重評價(jià)函數(shù);

46、根據(jù)所述第一目標(biāo)樣本、第二目標(biāo)樣本以及權(quán)重評價(jià)函數(shù)對第一決策樹進(jìn)行訓(xùn)練;

47、選取所述第一決策樹中符合預(yù)設(shè)條件的目標(biāo)決策樹分支對應(yīng)的判定規(guī)則為可用判定規(guī)則。

48、第四方面,本技術(shù)還提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述存儲(chǔ)介質(zhì)上存儲(chǔ)計(jì)算機(jī)程序,所述計(jì)算機(jī)程序使得計(jì)算機(jī)執(zhí)行如下操作:

49、根據(jù)預(yù)設(shè)規(guī)則在歷史樣本中選取第一目標(biāo)樣本,并對所述第一目標(biāo)樣本進(jìn)行打標(biāo);

50、隨機(jī)選取判定樣本為第二目標(biāo)樣本并對所述第二目標(biāo)樣本進(jìn)行打標(biāo);

51、為所述第一目標(biāo)樣本和第二目標(biāo)樣本分配樣本權(quán)重值,并根據(jù)所述樣本權(quán)重值生成權(quán)重評價(jià)函數(shù);

52、根據(jù)所述第一目標(biāo)樣本、第二目標(biāo)樣本以及權(quán)重評價(jià)函數(shù)對第一決策樹進(jìn)行訓(xùn)練;

53、選取所述第一決策樹中符合預(yù)設(shè)條件的目標(biāo)決策樹分支對應(yīng)的判定規(guī)則為可用判定規(guī)則。

54、本技術(shù)實(shí)現(xiàn)的有益效果為:

55、本技術(shù)提供了一種可用判定規(guī)則挖掘方法,包括根據(jù)預(yù)設(shè)規(guī)則在歷史樣本中選取第一目標(biāo)樣本,并對所述第一目標(biāo)樣本進(jìn)行打標(biāo);隨機(jī)選取判定樣本為第二目標(biāo)樣本并對所述第二目標(biāo)樣本進(jìn)行打標(biāo);為所述第一目標(biāo)樣本和第二目標(biāo)樣本分配樣本權(quán)重值,并根據(jù)所述樣本權(quán)重值生成權(quán)重評價(jià)函數(shù);根據(jù)所述第一目標(biāo)樣本、第二目標(biāo)樣本以及權(quán)重評價(jià)函數(shù)對第一決策樹進(jìn)行訓(xùn)練;選取所述第一決策樹中符合預(yù)設(shè)條件的目標(biāo)決策樹分支對應(yīng)的判定規(guī)則為可用判定規(guī)則。實(shí)現(xiàn)了對不同特征之間關(guān)聯(lián)規(guī)則的挖掘,進(jìn)一步挖掘出人為判定遺漏的可用判定規(guī)則,突破了人工設(shè)定判定規(guī)則的局限性;進(jìn)一步通過機(jī)器學(xué)習(xí)生成的可自動(dòng)判定的決策樹,大大提高了判定虛假訂單的判定效率以及準(zhǔn)確性。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1