本技術涉及數(shù)據(jù)處理,尤其涉及一種id映射關系的置信度評估方法、裝置及電子設備。
背景技術:
1、在數(shù)據(jù)處理技術領域,尤其是針對用戶的數(shù)據(jù)進行分析時,常基于用戶id(idification)構建各類id映射關系,然后借助構建的id映射關系對用戶的行為進行分析。比如基于用戶id與用戶所使用設備的設備號,構建“id-設備號”的映射關系,基于該id-設備號的映射關系,可知曉用戶曾使用哪些設備單登陸過該用戶id賬號。
2、但是,現(xiàn)有獲取用戶id映射關系的途徑較多,且可能存在多個用戶共享一個用戶id的情況,這樣容易使得所獲取到的用戶id映射關系的可用價值較低,如何對所獲取到的用戶id映射關系進行價值評估,成為一個提升id映射關系的可用價值所面臨的問題。
技術實現(xiàn)思路
1、有鑒于此,本技術實施例提供了一種id映射關系的置信度評估方法、裝置及電子設備,以對獲取到的id映射關系進行評估,進而確定出有價值的id映射關系。
2、第一方面,本技術提供了一種id映射關系的置信度評估方法,獲取各條待評估的id映射關系,其中,所述待評估的id映射關系的來源包括:展點數(shù)據(jù)、拼接數(shù)據(jù)、埋點數(shù)據(jù)、外部采集數(shù)據(jù)以及歷史id映射數(shù)據(jù)中的一種或多種;
3、解析各所述待評估的id映射關系包含的各項明細信息,并對各項所述明細信息進行賦值,各項明細信息包括:所述id映射關系的出現(xiàn)時間、來源、出現(xiàn)次數(shù)以及同一個用戶id對應的映射對象的個數(shù);
4、利用預設置信度分數(shù)計算模型,對各項所述明細信息的賦值結果計算加權求和統(tǒng)計結果,將所述加權求和統(tǒng)計結果確定為對應的id映射關系的置信度;
5、若所述置信度大于預設置信度統(tǒng)計分閾值,將所述大于預設置信度統(tǒng)計分閾值的待評估的id映射關系的評級屬性確定為可用id映射關系。
6、結合第一方面,在第二種可能的實施例中,所述獲取各條待評估的id映射關系包括:
7、從所述展點數(shù)據(jù)、拼接數(shù)據(jù)、埋點數(shù)據(jù)、外部采集數(shù)據(jù)中的一個或多個數(shù)據(jù)源中,獲取增量的待評估的id映射關系,并將所述增量的待評估的id映射關系存儲至增量數(shù)據(jù)庫中;
8、從所述歷史id映射數(shù)據(jù)中,獲取存量的待評估的id映射關系;
9、所述方法還包括:
10、若所述待評估的id映射關系的評級屬性為可用id映射關系,則將所述可用id映射關系存儲至目標id映射關系數(shù)據(jù)庫中。
11、結合第一方面,在第三種可能的實施例中,所述解析各所述待評估的id映射關系包含的各項明細信息,并對各項所述明細信息進行賦值,包括:
12、針對所述id映射關系的來源類型,對所述id映射關系的來源設置來源置信度分值,其中,所述拼接數(shù)據(jù)的置信度分值<所述展點數(shù)據(jù)的置信度分值<所述外部采集數(shù)據(jù)的置信度分值<所述埋點數(shù)據(jù)的置信度分值;
13、針對所述id映射關系的出現(xiàn)時間,對所述id映射關系的出現(xiàn)時間設置出現(xiàn)時間置信度分值,其中,所述id映射關系的出現(xiàn)時間越晚,所述出現(xiàn)時間置信度分值越高。
14、結合第一方面,在第四種可能的實施例中,所述解析各所述待評估的id映射關系包含的各項明細信息,并對各項所述明細信息進行賦值,包括:
15、針對所述id映射關系的出現(xiàn)次數(shù),按照如下公式確定所述id映射關系的出現(xiàn)次數(shù)置信度分值f(n):
16、f(n)=100*(n/(n+k))
17、其中,n為所述id映射關系的出現(xiàn)次數(shù),k為第一常數(shù)修正因子。
18、結合第一方面,在第五種可能的實施例中,所述解析各所述待評估的id映射關系包含的各項明細信息,并對各項所述明細信息進行賦值,包括:
19、針對所述同一個用戶id對應的映射對象個數(shù),按照如下公式確定出所述同一個用戶id對應的映射對象個數(shù)置信度分值g(m):
20、g(m)=100*(1-m/(m+p))
21、其中,m為所述同一個用戶id對應的映射對象的數(shù)量,p為第二常數(shù)修正因子。
22、第二方面,本技術提供了一種id映射關系的置信度評估裝置,所述裝置包括:
23、獲取模塊,用于獲取各條待評估的id映射關系,其中,所述待評估的id映射關系的來源包括:展點數(shù)據(jù)、拼接數(shù)據(jù)、埋點數(shù)據(jù)、外部采集數(shù)據(jù)以及歷史id映射數(shù)據(jù)中的一種或多種;
24、解析模塊,用于解析各所述待評估的id映射關系包含的各項明細信息,并對各項所述明細信息進行賦值,各項明細信息包括:所述id映射關系的出現(xiàn)時間、來源、出現(xiàn)次數(shù)以及同一個用戶id對應的映射對象的個數(shù);
25、第一確定模塊,用于利用預設置信度分數(shù)計算模型,對各項所述明細信息的賦值結果計算加權求和統(tǒng)計結果,將所述加權求和統(tǒng)計結果確定為對應的id映射關系的置信度;
26、第二確定模塊,若所述置信度大于預設置信度統(tǒng)計分閾值,將所述大于預設置信度統(tǒng)計分閾值的待評估的id映射關系的評級屬性確定為可用id映射關系。
27、結合第二方面,在第二種可能的實施例中,所述獲取模塊具體用于:
28、從所述展點數(shù)據(jù)、拼接數(shù)據(jù)、埋點數(shù)據(jù)、外部采集數(shù)據(jù)中的一個或多個數(shù)據(jù)源中,獲取增量的待評估的id映射關系,并將所述增量的待評估的id映射關系存儲至增量數(shù)據(jù)庫中;
29、從所述歷史id映射數(shù)據(jù)中,獲取存量的待評估的id映射關系;
30、所述裝置還包括:
31、存儲管理模塊,用于若所述待評估的id映射關系的評級屬性為可用id映射關系,則將所述可用id映射關系存儲至目標id映射關系數(shù)據(jù)庫中。
32、結合第二方面,在第三種可能的實施例中,所述解析模塊具體用于:
33、針對所述id映射關系的來源類型,對所述id映射關系的來源設置來源置信度分值,其中,所述拼接數(shù)據(jù)的置信度分值<所述展點數(shù)據(jù)的置信度分值<所述外部采集數(shù)據(jù)的置信度分值<所述埋點數(shù)據(jù)的置信度分值;
34、針對所述id映射關系的出現(xiàn)時間,對所述id映射關系的出現(xiàn)時間設置出現(xiàn)時間置信度分值,其中,所述id映射關系的出現(xiàn)時間越晚,所述出現(xiàn)時間置信度分值越高。
35、結合第二方面,在第四種可能的實施例中,所述解析模塊具體用于:
36、針對所述id映射關系的出現(xiàn)次數(shù),按照如下公式確定所述id映射關系的出現(xiàn)次數(shù)置信度分值:
37、f(n)=100*(n/(n+k))
38、其中,n為所述id映射關系的出現(xiàn)次數(shù),k為第一常數(shù)修正因子。
39、結合第二方面,在第五種可能的實施例中,所述解析模塊具體用于:
40、針對所述同一個用戶id對應的映射對象個數(shù),按照如下公式確定出所述同一個用戶id對應的映射對象個數(shù)置信度分值:
41、g(m)=100*(1-m/(m+p))
42、其中,m為所述同一個用戶id對應的映射對象的數(shù)量,p為第二常數(shù)修正因子。
43、第三方面,本技術提供了一種電子設備,所述電子設備包括:
44、處理器;以及存儲程序的存儲器,
45、其中,所述程序包括指令,所述指令在由所述處理器執(zhí)行時使所述處理器執(zhí)行根據(jù)第一方面所述的id映射關系的置信度評估方法。
46、第四方面,本技術提供了一種存儲有計算機指令的非瞬時計算機可讀存儲介質,其中,所述計算機指令用于使計算機執(zhí)行根據(jù)第一方面所述的id映射關系的置信度評估方法。
47、本技術的有益效果:
48、本技術提供了一種id映射關系的置信度評估方法、裝置以及電子設備,其中,該方法通過獲取各條待評估的id映射關系,然后解析出各條待評估的id映射關系的各項明細信息,并對各項明細信息進行賦值,然后利用預設置信度分數(shù)計算模型,基于各項明細信息的賦值結果進行加權求和,得到加權求和統(tǒng)計結果即為對應的id映射關系的置信度,若該置信度大于預設置信度統(tǒng)計分閾值,則將大于預設置信度統(tǒng)計分閾值的待評估的id映射關系的評級屬性確定為可用id映射關系。選用本技術實施例,通過獲取對用戶id映射關系的準確性產生影響的各項因素,然后基于該各項因素進行綜合評估得到各條id映射關系的置信度,并將置信度大于預設置信度閾值的id映射關系的評級屬性確定為可用id映射關系,如此可實現(xiàn)對獲取的用戶id映射關系進行價值評估,提升id映射關系的可用價值。