本技術(shù)實(shí)施例涉及航空數(shù)據(jù)處理領(lǐng)域,特別是涉及一種航行通告處理方法、裝置、設(shè)備、計(jì)算機(jī)產(chǎn)品及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、目前航行通告日益增多,航空公司大多采用數(shù)字化航行通告系統(tǒng),通告的分發(fā)、接受、處理、通報(bào)等流程都會(huì)在數(shù)字化系統(tǒng)中完成。由于航空運(yùn)行的特點(diǎn),航行通告常出現(xiàn)常態(tài)化限制,即高頻次發(fā)近似的通告限制。對(duì)近似的航行通告進(jìn)行識(shí)別和匹配,可以調(diào)取在先航行通告的處理結(jié)果,適當(dāng)應(yīng)用于與其相似的航行通告處理過(guò)程中,從而提升航行通告的處理效率。
2、現(xiàn)有技術(shù)僅能通過(guò)正則表達(dá)式模板或者簡(jiǎn)單字符重復(fù)性比較,直接匹配歷史數(shù)據(jù)中內(nèi)容或格式一致的航行通告和標(biāo)準(zhǔn)化處理模板,以此識(shí)別相似的航行通告。但由于航行通告e項(xiàng)內(nèi)容文本屬于自由文本發(fā)報(bào),其存在內(nèi)容的靈活性與多樣性,現(xiàn)有方法往往不能準(zhǔn)確的對(duì)航行通告e項(xiàng)內(nèi)容文本進(jìn)行識(shí)別,這不但降低了航行通告的處理效率,還存在錯(cuò)失重要航行通告內(nèi)容的風(fēng)險(xiǎn)。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提供了一種航行通告處理方法、裝置、設(shè)備、計(jì)算機(jī)產(chǎn)品及存儲(chǔ)介質(zhì),通過(guò)tf-idf算法,對(duì)航行通告中的e項(xiàng)內(nèi)容文本進(jìn)行進(jìn)一步的識(shí)別,從而更準(zhǔn)確的識(shí)別相似的航行通告,提升航行通告處理速度。
2、第一方面,本發(fā)明提供了一種航行通告處理方法,包括:
3、獲取待處理航行通告;
4、通過(guò)tf-idf算法對(duì)所述待處理航行通告進(jìn)行特征提取,獲得所述待處理航行通告的tf-idf向量;
5、將所述待處理航行通告的tf-idf向量與歷史航行通告進(jìn)行相似度評(píng)價(jià),獲得目標(biāo)歷史航行通告,其中,所述目標(biāo)歷史航行通告為與所述待處理航行通告的tf-idf向量相似度最高的歷史航行通告;
6、獲取所述目標(biāo)歷史航行通告對(duì)應(yīng)的限制處理數(shù)據(jù),并根據(jù)所述限制處理數(shù)據(jù)對(duì)所述待處理航行通告進(jìn)行處理。
7、進(jìn)一步地,所述將所述待處理航行通告的tf-idf向量與歷史航行通告進(jìn)行相似度評(píng)價(jià),獲得目標(biāo)歷史航行通告,包括:
8、通過(guò)tf-idf算法對(duì)所述歷史航行通告進(jìn)行特征提取,獲得所述歷史航行通告的tf-idf向量;
9、構(gòu)建歷史航行通告數(shù)據(jù)庫(kù),其中,所述歷史航行通告數(shù)據(jù)庫(kù)包括全部所述歷史航行通告的tf-idf向量;
10、計(jì)算所述待處理航行通告的tf-idf向量與所述歷史航行通告的tf-idf向量之間的余弦值相似度,確認(rèn)所述余弦值相似度最高的歷史航行通告為所述目標(biāo)歷史航行通告。
11、進(jìn)一步地,所述通過(guò)tf-idf算法對(duì)所述歷史航行通告進(jìn)行特征提取,獲得所述歷史航行通告的tf-idf向量,包括:
12、根據(jù)所述歷史航行通告,提取全部所述歷史航行通告的e項(xiàng)內(nèi)容;
13、對(duì)所述e項(xiàng)內(nèi)容進(jìn)行分詞和去停用詞處理,并根據(jù)所述分詞結(jié)果,創(chuàng)建歷史e項(xiàng)內(nèi)容向量矩陣;
14、對(duì)每一所述e項(xiàng)內(nèi)容中的分詞,計(jì)算該分詞的詞頻tfi,j,所述計(jì)算公式為:
15、
16、其中,ni,j指示該分詞在相應(yīng)e項(xiàng)內(nèi)容中的出現(xiàn)次數(shù),∑knk,j指示該e項(xiàng)內(nèi)容中經(jīng)過(guò)分詞和去停用詞處理后的總詞數(shù);
17、對(duì)每一所述e項(xiàng)內(nèi)容中的分詞,計(jì)算該分詞的逆向文件頻率idfi,所述計(jì)算公式為:
18、
19、其中,|d|指示所述歷史航行通告的總數(shù)量,1+j:ti∈dj|指示包含該分詞的歷史航行通告數(shù)量;
20、根據(jù)所述分詞的詞頻和逆向文件頻率,計(jì)算所述歷史航行通告的tf-idf向量,所述計(jì)算公式為:
21、tf-idf=tfi,j×idfi。
22、進(jìn)一步地,所述計(jì)算所述待處理航行通告的tf-idf向量與所述歷史航行通告的tf-idf向量之間的余弦值相似度,其中,所述余弦值相似度的計(jì)算方法,包括:
23、根據(jù)所述待處理航行通告的tf-idf向量與每一所述歷史航行通告的tf-idf向量,獲得余弦值,所述余弦值的計(jì)算公式為:
24、a·b=|a|·|b|cosθ
25、其中,向量a指示所述待處理航行通告的tf-idf向量,向量b指示所述歷史航行通告的tf-idf向量;
26、根據(jù)所述余弦值,獲得所述余弦值相似度,所述余弦值相似度的計(jì)算公式為:
27、
28、其中,向量ai指示所述待處理航行通告的tf-idf向量的分量,向量bi指示所述歷史航行通告的tf-idf向量的分量。
29、進(jìn)一步地,所述獲取所述目標(biāo)歷史航行通告對(duì)應(yīng)的限制處理數(shù)據(jù),并根據(jù)所述限制處理數(shù)據(jù)對(duì)所述待處理航行通告進(jìn)行處理,包括:
30、根據(jù)所述目標(biāo)歷史航行通告對(duì)應(yīng)的限制處理數(shù)據(jù),生成數(shù)據(jù)復(fù)用提示,所述數(shù)據(jù)復(fù)用提示用于指示工作人員對(duì)是否限制數(shù)據(jù)復(fù)用進(jìn)行選擇;
31、響應(yīng)于工作人員輸入的處理信號(hào),對(duì)所述待處理航行通告進(jìn)行處理。
32、第二方面,本發(fā)明還提供一種航行通告處理裝置,包括:
33、航行通告獲取模塊,用于獲取待處理航行通告;
34、特征向量獲取模塊,用于通過(guò)tf-idf算法對(duì)所述待處理航行通告進(jìn)行特征提取,獲得所述待處理航行通告的tf-idf向量;
35、目標(biāo)歷史通告獲取模塊,用于將所述待處理航行通告的tf-idf向量與歷史航行通告進(jìn)行相似度評(píng)價(jià),獲得目標(biāo)歷史航行通告,其中,所述目標(biāo)歷史航行通告為與所述待處理航行通告的tf-idf向量相似度最高的歷史航行通告;
36、航行通告處理模塊,用于獲取所述目標(biāo)歷史航行通告對(duì)應(yīng)的限制處理數(shù)據(jù),并根據(jù)所述限制處理數(shù)據(jù)對(duì)所述待處理航行通告進(jìn)行處理。
37、進(jìn)一步地,所述目標(biāo)歷史通告獲取模塊,包括:
38、歷史通告特征向量獲取單元,用于通過(guò)tf-idf算法對(duì)所述歷史航行通告進(jìn)行特征提取,獲得所述歷史航行通告的tf-idf向量;
39、歷史數(shù)據(jù)庫(kù)構(gòu)建單元,用于構(gòu)建歷史航行通告數(shù)據(jù)庫(kù),其中,所述歷史航行通告數(shù)據(jù)庫(kù)包括全部所述歷史航行通告的tf-idf向量;
40、余弦相似度計(jì)算單元,用于計(jì)算所述待處理航行通告的tf-idf向量與所述歷史航行通告的tf-idf向量之間的余弦值相似度,確認(rèn)所述余弦值相似度最高的歷史航行通告為所述目標(biāo)歷史航行通告。
41、第三方面,本發(fā)明還提供一種計(jì)算機(jī)設(shè)備,包括:
42、至少一個(gè)存儲(chǔ)器以及至少一個(gè)處理器;
43、所述存儲(chǔ)器,用于存儲(chǔ)一個(gè)或多個(gè)程序;
44、當(dāng)所述一個(gè)或多個(gè)程序被所述至少一個(gè)處理器執(zhí)行,使得所述至少一個(gè)處理器實(shí)現(xiàn)如第一方面所述的航行通告處理方法的步驟。
45、第四方面,本發(fā)明還提供一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序/指令,其特征在于,該計(jì)算機(jī)程序/指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如第一方面所述的航行通告處理方法的步驟
46、第五方面,本發(fā)明還提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如第一方面所述的航行通告處理方法的步驟。
47、本發(fā)明通過(guò)獲取待處理航行通告,再通過(guò)tf-idf算法對(duì)所述待處理航行通告進(jìn)行特征提取,獲得所述待處理航行通告的tf-idf向量;將所述待處理航行通告的tf-idf向量與歷史航行通告進(jìn)行相似度評(píng)價(jià),獲得目標(biāo)歷史航行通告,其中,所述目標(biāo)歷史航行通告為與所述待處理航行通告的tf-idf向量相似度最高的歷史航行通告;再獲取所述目標(biāo)歷史航行通告對(duì)應(yīng)的限制處理數(shù)據(jù),并根據(jù)所述限制處理數(shù)據(jù)對(duì)所述待處理航行通告進(jìn)行處理。本技術(shù)在用tf-idf算法進(jìn)行特征向量提取后,通過(guò)相似度計(jì)算方法匹配歷史航行通告中的近似通告,解決了航行通告e項(xiàng)自由文本所導(dǎo)致的匹配困難問(wèn)題。通過(guò)近似通告匹配,可以直接調(diào)取近似通告的限制處理數(shù)據(jù),不但節(jié)省了航行通告的人力處理成本,也可以提高航行通告的及時(shí)處理率和準(zhǔn)確率。
48、為了更清楚地說(shuō)明本技術(shù)實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本技術(shù)的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。