一種多級維度動態(tài)切換分級及匯總的實(shí)現(xiàn)方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于計算機(jī)技術(shù)的大數(shù)據(jù)、商業(yè)智能領(lǐng)域,尤其設(shè)及一種多級維度動態(tài)切 換及匯總的實(shí)現(xiàn)方法。
【背景技術(shù)】
[0002] 在計算機(jī)技術(shù)的大數(shù)據(jù)、商業(yè)智能領(lǐng)域中,維度是一個基本概念,也是一類數(shù)據(jù)。 如從年齡角度分析數(shù)據(jù)的構(gòu)成情況,了解少年、青年、中年、老年人的數(shù)據(jù)量多少,則運(yùn)個年 齡就是觀察角度,也是一個維度,而"少年"、"青年"、"中年"、"老年"都是運(yùn)個維度的成員, 維度成員有時也用數(shù)值分段即分檔的形式表示,如用"10-20"、"20-30"、"30-40"等字樣來 做年齡維度的成員構(gòu)成,其中分檔提示"10-20"的字樣用來表示年齡大于等于10歲而又小 于20歲的情況,其他分檔字樣的含義依次類推。在商業(yè)智能領(lǐng)域的數(shù)據(jù)統(tǒng)計分析過程中會 使用多個維度,舉例如年齡、性別、職業(yè)、學(xué)歷、愛好等等,運(yùn)些維度是限制過濾數(shù)據(jù)和統(tǒng)計 分析數(shù)據(jù)的重要手段,維度的多少也直接影響了統(tǒng)計分析數(shù)據(jù)的豐富及細(xì)致程度,對于數(shù) 據(jù)價值發(fā)掘、利用意義重大。
[0003] 前述舉例說明了維度的基本概念,通常維度的成員構(gòu)成沒有統(tǒng)一標(biāo)準(zhǔn),多W滿足 統(tǒng)計分析要求前提下越簡單、越少越好,成員構(gòu)成簡單則生成的統(tǒng)計圖表也簡單,便于分析 人員理解,成員個數(shù)少不但有利于分析人員交互操作,而且還能降低系統(tǒng)處理的開銷,提高 處理速度。維度成員構(gòu)成雖沒有統(tǒng)一標(biāo)準(zhǔn),但存在隱含的正交分類要求,即維度成員應(yīng)不重 疊、包含又能嚴(yán)密覆蓋所有數(shù)據(jù),換句話說就是一項(xiàng)數(shù)據(jù)需要屬于且僅屬于維度的一個成 員。維度成員構(gòu)成違法正交性要求會引發(fā)數(shù)據(jù)表達(dá)及理解錯誤。前述年齡維度采用其中任 何一種構(gòu)成方式都是比較簡單的,但如果分析需求比較復(fù)雜而維度成員的簡單構(gòu)成不滿足 需要時,則需構(gòu)造、使用多級維度。
[0004] 多級維度的成員構(gòu)成也沒有統(tǒng)一標(biāo)準(zhǔn),同樣是W具體分析場景、需求來設(shè)計和構(gòu) 成的,也不具備場景外的普適性。雖然大數(shù)據(jù)、商業(yè)智能領(lǐng)域中真實(shí)的多級維度很多,運(yùn)里 還是W年齡維度舉例說明,便于對比、理解。如果首先將年齡分成"適學(xué)"、"適工"、"退休" 幾個成員,再將"適學(xué)"成員分成"5-10"、"10-15"、"15-20"、"20-25"等幾個分檔,至此年齡 維度就是一個兩級的多級維度了。如使用年齡的一級維度則按"適學(xué)"、"適工"、"退休"分 別統(tǒng)計匯總數(shù)據(jù),使用年齡的二級維度則按"5-10"、"10-15"、"15-20"、"20-25"分別統(tǒng)計 匯總數(shù)據(jù)。多級維度是一個維度,但在使用上卻有多個簡單維度的效果,對于統(tǒng)計分析特別 有幫助。運(yùn)個年齡多級維度還可W繼續(xù)補(bǔ)充完善成員的構(gòu)成,繼續(xù)擴(kuò)至Ξ級、四級或更多維 度,但即使是兩級的多級維度也比簡單維度處理復(fù)雜很多,尤其是統(tǒng)計分析時級別的切換、 數(shù)據(jù)匯總更是復(fù)雜了。實(shí)現(xiàn)多級維度統(tǒng)計分析時即時進(jìn)行觀察級別切換、統(tǒng)計匯總功能,并 降低實(shí)現(xiàn)的存儲開銷,提高計算速度,增加靈活性、普適性,可W有效推動多級維度的應(yīng)用, 為業(yè)務(wù)分析提供有效支撐。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明針對多級維度即時進(jìn)行觀察級別切換、統(tǒng)計匯總功能的不足,提供了一種 多級維度動態(tài)切換及匯總的實(shí)現(xiàn)方法。通過定義多級維度缺省觀察級別、維度定長前綴編 碼、維度編碼KV存儲、級別轉(zhuǎn)換字符數(shù)、編碼到維度名稱的查找和轉(zhuǎn)換、根據(jù)維度名稱進(jìn)行 數(shù)據(jù)匯總、多級維度級別展示及切換選擇等步驟和方法實(shí)現(xiàn)多級維度即時進(jìn)行觀察級別切 換、統(tǒng)計匯總。
[0006] 發(fā)明步驟、方法的定義多級維度缺省觀察級別是因?yàn)槎嗉壘S度在觀察數(shù)據(jù)的一刻 只能按其中的一個級別進(jìn)行數(shù)據(jù)的統(tǒng)計匯總,定義缺省觀察級別指定按哪個級別進(jìn)行統(tǒng)計 匯總,即時修改缺省觀察級別也就動態(tài)切換了多級維度的觀察角度,改變了統(tǒng)計匯總級別, 從而獲得統(tǒng)計匯總數(shù)據(jù)不同,實(shí)現(xiàn)了業(yè)務(wù)上需要的多級別分析。
[0007] 發(fā)明步驟、方法的維度定長前綴編碼是指定多級維度不同級別使用固定個數(shù)的字 符進(jìn)行編碼,前一級編碼是后一級編碼的前綴,如此定義了數(shù)據(jù)的包含及擴(kuò)展關(guān)系。
[0008] 發(fā)明步驟、方法的維度編碼KV存儲是指多級維度的全部編碼定義W及編碼和維 度名稱的對應(yīng)關(guān)系WKV的方式進(jìn)行存儲,W加快由維度編碼查找、轉(zhuǎn)換維度名稱時的隨機(jī) 查找速度。
[0009] 發(fā)明步驟、方法的級別轉(zhuǎn)換字符數(shù)是根據(jù)各級編碼長度計算出特定級別編碼所對 應(yīng)的字符數(shù),其中一級編碼的字符數(shù)是其本身編碼長度,二級編碼的字符數(shù)是一級編碼長 度加上二級編碼本身的長度,因此比一級編碼長,Ξ級、四級字符數(shù)也用類似的方法計算。
[0010] 發(fā)明步驟、方法的編碼到維度名稱的查找和轉(zhuǎn)換是分級統(tǒng)計分析的一個中間步 驟。為節(jié)省存儲空間,待統(tǒng)計分析數(shù)據(jù)中多級維度只存一個數(shù)據(jù)項(xiàng),運(yùn)個數(shù)據(jù)項(xiàng)內(nèi)容為該多 級維度最大級別的編碼,是定長數(shù)據(jù)項(xiàng),其前綴是一級編碼、二級編碼等。如按k級編碼統(tǒng) 計分析數(shù)據(jù)時需先將級別數(shù)k轉(zhuǎn)換為對應(yīng)編碼長度字符數(shù)n,多級維度數(shù)據(jù)項(xiàng)均取前η個字 符按KV的方式查找多級維度編碼定義,提取相應(yīng)的維度名稱。
[0011] 發(fā)明步驟、方法的根據(jù)維度名稱進(jìn)行數(shù)據(jù)匯總是將數(shù)據(jù)按維度名稱相同與否進(jìn)行 累加、匯總數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)按維度組織。
[0012] 發(fā)明步驟、方法的多級維度級別展示及切換選擇是把基于多級維度缺省觀察級別 統(tǒng)計匯總的數(shù)據(jù)W匯總表及分析圖形的方式在圖形用戶界面上呈現(xiàn)出來,同時提示出當(dāng)前 缺省觀察級別到底是哪一級,允許即時修改成其他分級并即時匯總數(shù)據(jù)、刷新呈現(xiàn)的用戶 界面。
[0013] 本發(fā)明針對多級維度即時進(jìn)行觀察級別切換、統(tǒng)計匯總功能的不足,提供了一種 多級維度動態(tài)切換及匯總的實(shí)現(xiàn)方法,實(shí)現(xiàn)多級維度統(tǒng)計分析時即時進(jìn)行觀察級別切換、 統(tǒng)計匯總功能,并降低存儲開銷,提高計算速度,增加靈活性、普適性,可W有效推動多級維 度的應(yīng)用,為業(yè)務(wù)分析提供有力支撐。
【附圖說明】
[0014] 圖1為本發(fā)明一種多級維度動態(tài)切換及匯總的實(shí)現(xiàn)方法之步驟方法示意。
[0015] 圖2為本發(fā)明一種多級維度動態(tài)切換及匯總的實(shí)現(xiàn)方法之缺省觀察級別突出顯 示及即時切換示意圖。其中子圖201為突出顯示功能項(xiàng),表明"1級"是當(dāng)前缺省觀察級別。 子圖202、203、204是非當(dāng)前缺省觀察級別,但是可W通過鼠標(biāo)點(diǎn)擊即時切換為缺省觀察級 另IJ。多級維度有且僅有一項(xiàng)是缺省觀察級別,當(dāng)設(shè)定了新的缺省觀察級別,之前的缺省觀察 級別自動變?yōu)榉侨笔∮^察級別了。
[0016] 圖3多級維度的缺省分級做觀察角度實(shí)現(xiàn)示意圖,界面鼠標(biāo)指向"標(biāo)準(zhǔn)產(chǎn)品"是多 級分檔維度,其缺省觀察角度為3級,統(tǒng)計匯總數(shù)據(jù)按3級維度名稱進(jìn)行標(biāo)記,兩個指標(biāo)、條 形圖呈現(xiàn)的效果,從使用角度看多級維度的數(shù)據(jù)呈現(xiàn)和簡單維度是一樣的。
[0017] 圖4多級維度即時修改缺省觀察角度示意圖,在多級分檔"標(biāo)準(zhǔn)產(chǎn)品"已是當(dāng)前觀 察維度時點(diǎn)擊鼠標(biāo),彈出截圖的本窗口。其中"3級"是缺省觀察角度,呈現(xiàn)突出顯示狀態(tài), 下方對應(yīng)"3級"數(shù)據(jù)統(tǒng)計匯總情況。鼠標(biāo)指向的"2級"是可W設(shè)定為新的缺省觀察角度 的級別。
[0018] 圖5多級維度即時切換缺省顯示級別后的頁面刷新示意圖,和切換之前相比,統(tǒng) 計分析圖形的標(biāo)注發(fā)生變化。
【具體實(shí)施方式】
[0019] 為使本發(fā)明一種多級維度動態(tài)切換及匯總的實(shí)現(xiàn)方法之目的、技術(shù)方案和優(yōu)點(diǎn)更 加清楚,W下結(jié)合優(yōu)先實(shí)施例電信公司產(chǎn)品的多級維度來詳細(xì)說明實(shí)現(xiàn)的方法和技術(shù)細(xì) 節(jié)。借此對本發(fā)明如何應(yīng)用技術(shù)手段解決技術(shù)問題,并達(dá)成技術(shù)效果的實(shí)現(xiàn)過程能充分理 解并據(jù)W實(shí)施。 陽020]調(diào)研并確定多級維度使用場景需求
[0021] 前述維度和多級維度的設(shè)計實(shí)現(xiàn)均須W滿足使用場景需求為前提,并在運(yùn)個前提 下追求盡可能簡單、高效、靈活地實(shí)現(xiàn),因此調(diào)研并確定多級維度使用場景需求是本發(fā)明一 種多級維度動態(tài)切換及匯總的實(shí)現(xiàn)方法具體實(shí)施工作的第一步。
[0022] 電信公司產(chǎn)品的多級維度實(shí)例使用場景需求調(diào)研及確認(rèn)如表1所示。
[0023]
[0024]表 1 陽0巧]定義缺省觀察級別
[0026] 在發(fā)明步驟、方法的定義缺省觀察級別實(shí)施過程就是設(shè)置一個存儲變量,記錄多 級維度的缺省觀察級別,初始值為1,在系統(tǒng)使用操作過程中修改,記錄最新的缺省觀察級 別。
[0027] 維度定長前綴編碼、維度編碼KV存儲的實(shí)施
[0028] 在發(fā)明步驟、方法的維度定長前綴編碼、維度編碼KV存儲的實(shí)施過程中需要先定 義多級維度存儲結(jié)構(gòu),示意如下,其中的fl化ame存放多級維度字段名稱,dimid存放多級 維度編碼,di皿ame存放維度名稱。又fl化ame和dimid合起來做哈希索引的key,di皿ame 做value,數(shù)據(jù)WKV的方式存儲和查找。
[0029] KV存儲及查詢實(shí)現(xiàn)方式有多種可選,可W自行設(shè)計、構(gòu)造散列存儲體,提供配套的 查詢代碼,整個系統(tǒng)渾然一體。也可W找成熟的KV框架搭建KV服務(wù),完成KV數(shù)據(jù)的存儲 及查詢服務(wù)。
[0030] 存放多級維度字段名稱的好處在于使得運(yùn)一個存儲結(jié)構(gòu)可W存放所有的多級維 度編碼及名稱,方便系統(tǒng)使用和維護(hù)。
[0031]
[0032] 電信公司產(chǎn)品的多級維度定義如下:
[0033] ProductID,*,4 :2 :5 :7 :9
[0034] ProductID, 10,接入類
[0035] ProductID, 10101,通信類
[0036] ProductID, 1010101,固定電話
[0037] ProductID, 101010101,固定電話僅含本地語音
[0038] ProductID,101010102,固定公用電話
[0039