本公開涉及移動(dòng)通信,尤其涉及一種數(shù)據(jù)清洗方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、mdt(minimization?drive?test,最小化路測(cè)),是通信系統(tǒng)實(shí)現(xiàn)自動(dòng)化采集和分析含位置信息的ue測(cè)量報(bào)告的技術(shù),用于最大程度上減小人工路測(cè)的工作量。
2、當(dāng)網(wǎng)絡(luò)打開mdt功能開關(guān),且移動(dòng)終端滿足一定條件的情況下,移動(dòng)終端會(huì)向網(wǎng)絡(luò)上報(bào)包含位置信息的測(cè)量報(bào)告,該報(bào)告簡(jiǎn)稱為mdt數(shù)據(jù)。該數(shù)據(jù)除包含終端當(dāng)時(shí)的位置信息外,還包含終端當(dāng)時(shí)的信號(hào)特征,如果某片區(qū)域采集到足夠多的mdt數(shù)據(jù),則可以建立信號(hào)特征與位置信息之間的映射關(guān)系,即mdt指紋庫(kù)。位置信息異常是指終端由于受人工干擾或定位模塊失步影響,所報(bào)告的部分mdt數(shù)據(jù)中的位置信息與其實(shí)際位置有較大誤差,這種數(shù)據(jù)對(duì)mdt指紋庫(kù)會(huì)造成很大的負(fù)面影響。
3、目前,檢測(cè)位置信息異常的mdt數(shù)據(jù)的準(zhǔn)確率較低。
技術(shù)實(shí)現(xiàn)思路
1、本公開提供一種數(shù)據(jù)清洗方法,以至少解決現(xiàn)有檢測(cè)位置信息異常的mdt數(shù)據(jù)的準(zhǔn)確率較低的問題。
2、本公開的技術(shù)方案如下:
3、本公開實(shí)施例提供一種數(shù)據(jù)清洗方法,包括:
4、獲取目標(biāo)用戶在設(shè)定時(shí)間段內(nèi)的mdt數(shù)據(jù);
5、根據(jù)所述mdt數(shù)據(jù),確定所述設(shè)定時(shí)間段內(nèi)的多個(gè)運(yùn)動(dòng)速度;
6、在多個(gè)所述運(yùn)動(dòng)速度均小于預(yù)設(shè)速度閾值的情況下,則根據(jù)每個(gè)所述運(yùn)動(dòng)速度的衍生數(shù)據(jù),確定每個(gè)所述運(yùn)動(dòng)速度的數(shù)據(jù)類型;
7、根據(jù)每個(gè)所述運(yùn)動(dòng)速度的數(shù)據(jù)類型,對(duì)所述設(shè)定時(shí)間段內(nèi)的mdt數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗。
8、可選地,每條所述mdt數(shù)據(jù)包括:位置信息和時(shí)間信息,根據(jù)所述mdt數(shù)據(jù),確定所述設(shè)定時(shí)間段內(nèi)的多個(gè)運(yùn)動(dòng)速度,包括:
9、針對(duì)任意相鄰兩條mdt數(shù)據(jù),根據(jù)相鄰兩條mdt數(shù)據(jù)的位置信息和時(shí)間信息,確定任意相鄰兩條mdt數(shù)據(jù)的運(yùn)動(dòng)速度;
10、根據(jù)任意相鄰兩條mdt數(shù)據(jù)的運(yùn)動(dòng)速度,組成所述設(shè)定時(shí)間段內(nèi)的多個(gè)運(yùn)動(dòng)速度。
11、可選地,所述衍生數(shù)據(jù)包括:平均速度、標(biāo)準(zhǔn)差和殘差;在所述根據(jù)每個(gè)所述運(yùn)動(dòng)速度的衍生數(shù)據(jù),確定每個(gè)所述運(yùn)動(dòng)速度的數(shù)據(jù)類型之前,所述方法還包括:
12、確定所述設(shè)定時(shí)間段內(nèi)的多個(gè)運(yùn)動(dòng)速度的所述平均速度和所述標(biāo)準(zhǔn)差;
13、根據(jù)每個(gè)所述運(yùn)動(dòng)速度和所述平均速度,確定每個(gè)所述運(yùn)動(dòng)速度的所述殘差;以及
14、根據(jù)目標(biāo)臨界值和所述標(biāo)準(zhǔn)差,確定判定閾值。
15、可選地,在所述根據(jù)目標(biāo)臨界值和所述標(biāo)準(zhǔn)差,確定判定閾值之前,所述方法還包括:
16、根據(jù)多個(gè)所述運(yùn)動(dòng)速度的數(shù)量和目標(biāo)置信概率,查詢置信概率、測(cè)量次數(shù)和臨界值的映射關(guān)系表,得到目標(biāo)臨界值。
17、可選地,所述根據(jù)每個(gè)所述運(yùn)動(dòng)速度的衍生數(shù)據(jù),確定每個(gè)所述運(yùn)動(dòng)速度的數(shù)據(jù)類型,包括:
18、針對(duì)多個(gè)所述運(yùn)動(dòng)速度中的目標(biāo)運(yùn)動(dòng)速度,在所述目標(biāo)運(yùn)動(dòng)速度的殘差的絕對(duì)值大于所述判定閾值的情況下,則確定所述目標(biāo)運(yùn)動(dòng)速度的數(shù)據(jù)類型為異常數(shù)據(jù);
19、在所述目標(biāo)運(yùn)動(dòng)速度的殘差的絕對(duì)值小于等于所述判定閾值的情況下,則確定所述目標(biāo)運(yùn)動(dòng)速度的數(shù)據(jù)類型為正常數(shù)據(jù)。
20、可選地,所述根據(jù)每個(gè)所述運(yùn)動(dòng)速度的數(shù)據(jù)類型,對(duì)所述設(shè)定時(shí)間段內(nèi)的mdt數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,包括:
21、在多個(gè)所述運(yùn)動(dòng)速度中的目標(biāo)運(yùn)動(dòng)速度的數(shù)據(jù)類型為異常數(shù)據(jù)的情況下,則將所述設(shè)定時(shí)間段內(nèi)mdt數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗;或者,
22、在多個(gè)所述運(yùn)動(dòng)速度中的目標(biāo)運(yùn)動(dòng)速度的數(shù)據(jù)類型為異常數(shù)據(jù)的情況下,則將所述目標(biāo)運(yùn)動(dòng)速度對(duì)應(yīng)的兩條mdt數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗。
23、本公開實(shí)施例還提供一種數(shù)據(jù)清洗裝置,包括:
24、獲取模塊,用于獲取目標(biāo)用戶在設(shè)定時(shí)間段內(nèi)的mdt數(shù)據(jù);
25、第一確定模塊,用于根據(jù)所述mdt數(shù)據(jù),確定所述設(shè)定時(shí)間段內(nèi)的多個(gè)運(yùn)動(dòng)速度;
26、第二確定模塊,在多個(gè)所述運(yùn)動(dòng)速度均小于預(yù)設(shè)速度閾值的情況下,則用于根據(jù)每個(gè)所述運(yùn)動(dòng)速度的衍生數(shù)據(jù),確定每個(gè)所述運(yùn)動(dòng)速度的數(shù)據(jù)類型;
27、數(shù)據(jù)清洗模塊,用于根據(jù)每個(gè)所述運(yùn)動(dòng)速度的數(shù)據(jù)類型,對(duì)所述設(shè)定時(shí)間段內(nèi)的mdt數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗。
28、本公開實(shí)施例還提供一種電子設(shè)備,包括:
29、處理器;
30、用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器;
31、其中,所述處理器被配置為執(zhí)行所述指令,以實(shí)現(xiàn)上述的方法中的各步驟。
32、本公開實(shí)施例還提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述的方法中的各步驟。
33、本公開實(shí)施例還提供一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序/指令,所述計(jì)算機(jī)程序/指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述的方法中的各步驟。
34、本公開的實(shí)施例提供的技術(shù)方案至少帶來以下有益效果:
35、本公開實(shí)施例提供一種數(shù)據(jù)清洗方法,包括:
36、在本公開的一些實(shí)施例中,獲取目標(biāo)用戶在設(shè)定時(shí)間段內(nèi)的mdt數(shù)據(jù);根據(jù)mdt數(shù)據(jù),確定設(shè)定時(shí)間段內(nèi)的多個(gè)運(yùn)動(dòng)速度;在多個(gè)運(yùn)動(dòng)速度均小于預(yù)設(shè)速度閾值的情況下,則根據(jù)每個(gè)運(yùn)動(dòng)速度的衍生數(shù)據(jù),確定每個(gè)運(yùn)動(dòng)速度的數(shù)據(jù)類型,以確定是否存在異常類型的運(yùn)動(dòng)速度;根據(jù)每個(gè)運(yùn)動(dòng)速度的數(shù)據(jù)類型,對(duì)設(shè)定時(shí)間段內(nèi)的mdt數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,提高位置信息異常的mdt數(shù)據(jù)的檢測(cè)準(zhǔn)確率。
37、應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本公開。
1.一種數(shù)據(jù)清洗方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,每條所述mdt數(shù)據(jù)包括:位置信息和時(shí)間信息,根據(jù)所述mdt數(shù)據(jù),確定所述設(shè)定時(shí)間段內(nèi)的多個(gè)運(yùn)動(dòng)速度,包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述衍生數(shù)據(jù)包括:平均速度、標(biāo)準(zhǔn)差和殘差;在所述根據(jù)每個(gè)所述運(yùn)動(dòng)速度的衍生數(shù)據(jù),確定每個(gè)所述運(yùn)動(dòng)速度的數(shù)據(jù)類型之前,所述方法還包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,在所述根據(jù)目標(biāo)臨界值和所述標(biāo)準(zhǔn)差,確定判定閾值之前,所述方法還包括:
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)每個(gè)所述運(yùn)動(dòng)速度的衍生數(shù)據(jù),確定每個(gè)所述運(yùn)動(dòng)速度的數(shù)據(jù)類型,包括:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)每個(gè)所述運(yùn)動(dòng)速度的數(shù)據(jù)類型,對(duì)所述設(shè)定時(shí)間段內(nèi)的mdt數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,包括:
7.一種數(shù)據(jù)清洗裝置,其特征在于,包括:
8.一種電子設(shè)備,其特征在于,包括:
9.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1-6中任一項(xiàng)所述的方法中的各步驟。
10.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序/指令,其特征在于,所述計(jì)算機(jī)程序/指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1-6中任一項(xiàng)所述的方法中的各步驟。