一種基于移動應(yīng)用的互聯(lián)網(wǎng)用戶數(shù)據(jù)分析方法

文檔序號：10597253閱讀：378來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

一種基于移動應(yīng)用的互聯(lián)網(wǎng)用戶數(shù)據(jù)分析方法
【專利摘要】本發(fā)明公開了一種基于移動應(yīng)用的互聯(lián)網(wǎng)用戶數(shù)據(jù)分析方法，包括步驟：1)用戶行為數(shù)據(jù)采集；2)崩潰分析；3)關(guān)鍵路徑轉(zhuǎn)化率分析；4)頻繁序列挖掘；5)聚類分析。本發(fā)明根據(jù)移動互聯(lián)網(wǎng)特點，研究移動用戶的群體使用行為，協(xié)助開發(fā)者設(shè)計更加完美的軟件應(yīng)用并提高程序調(diào)試效率，從而提升移動應(yīng)用開發(fā)質(zhì)量?？蓪Υ笮蜕缃?、電商、電子政務(wù)等移動互聯(lián)網(wǎng)行業(yè)平臺應(yīng)用的數(shù)據(jù)內(nèi)容搜集與獲取提供良好而廣泛的共性技術(shù)支撐。
【專利說明】
一種基于移動應(yīng)用的互聯(lián)網(wǎng)用戶數(shù)據(jù)分析方法
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及移動互聯(lián)網(wǎng)的技術(shù)領(lǐng)域，尤其是指一種基于移動應(yīng)用的互聯(lián)網(wǎng)用戶數(shù)據(jù)分析方法。
【背景技術(shù)】
[0002]近年來，隨著智能手機、平板電腦等移動終端設(shè)備逐漸普及，依托3G、4G網(wǎng)絡(luò)和強大云端服務(wù)支持的移動互聯(lián)網(wǎng)行業(yè)成長迅速。據(jù)2015年《第35次互聯(lián)網(wǎng)發(fā)展狀況統(tǒng)計報告》統(tǒng)計，中國網(wǎng)民規(guī)模達6.49億，手機網(wǎng)民規(guī)模達5.57億，手機上網(wǎng)已經(jīng)逐漸成為上網(wǎng)的首選方式，達到上網(wǎng)總?cè)藬?shù)的85.8%。作為移動互聯(lián)網(wǎng)的核心內(nèi)容，移動應(yīng)用正在人們的日常工作和生活中扮演著越來越重要的角色，移動應(yīng)用在為用戶帶來豐富的體驗的同時，更帶來了網(wǎng)絡(luò)時代新型的營銷方式。移動終端多樣性、接入靈活性、智能與傳感的特性也對軟件應(yīng)用及其服務(wù)質(zhì)量提出了更高要求，一個應(yīng)用在某類手機平臺上穩(wěn)定而正常工作，換款手機，升級操作系統(tǒng)往往會帶來閃退，黑屏等諸多問題，研究移動應(yīng)用可靠性保障技術(shù)比傳統(tǒng)基于PC應(yīng)用需求更為迫切;此外智能手機與個人信息的深度綁定，通過對各種類型移動應(yīng)用的用戶使用行為數(shù)據(jù)進行挖掘和分析，不僅能挖掘出更為個性化的信息，使得業(yè)務(wù)開展更具針對性，更能挖掘行業(yè)痛點，在極短時間有可能實現(xiàn)業(yè)務(wù)的爆發(fā)式拓展。

【發(fā)明內(nèi)容】

[0003]本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足，提供一種基于移動應(yīng)用的互聯(lián)網(wǎng)用戶數(shù)據(jù)分析方法，根據(jù)移動互聯(lián)網(wǎng)特點，研究移動用戶的群體使用行為，協(xié)助開發(fā)者設(shè)計更加完美的軟件應(yīng)用并提高程序調(diào)試效率，從而提升移動應(yīng)用的開發(fā)質(zhì)量。
[0004]為實現(xiàn)上述目的，本發(fā)明所提供的技術(shù)方案為:一種基于移動應(yīng)用的互聯(lián)網(wǎng)用戶數(shù)據(jù)分析方法，包括以下步驟:
[0005]I)用戶行為數(shù)據(jù)采集
[0006]在保證移動應(yīng)用源代碼的邏輯完整性的基礎(chǔ)上，在程序中插入可定制的數(shù)據(jù)收集代碼，這部分工作在編譯期完成，不污染源代碼，通過觸發(fā)插粧代碼的執(zhí)行來獲取程序運行的相關(guān)數(shù)據(jù)，并通過自定義事件和自定義指標的跟蹤和分析，獲得程序的控制流和數(shù)據(jù)流信息，從而實現(xiàn)數(shù)據(jù)收集的目的；其中，主要收集應(yīng)用的新增用戶、活躍用戶、啟動次數(shù)、版本分布、用戶地域分布這些行業(yè)指標數(shù)據(jù)，以及每個用戶在使用移動應(yīng)用時頁面的瀏覽順序，每個頁面的平均加載時間、逗留時間這些用戶行為數(shù)據(jù)；
[0007]2)崩潰分析
[0008]研究各主流操作系統(tǒng)不可檢測異常的調(diào)用過程和工作原理，通過重寫操作系統(tǒng)底層的異常捕獲機制來實現(xiàn)個性化的崩潰信息收集和分析，從而達到在移動應(yīng)用發(fā)生異常時能實時收集開發(fā)者定制的異常信息，包括:I)移動設(shè)備的硬件信息:操作系統(tǒng)類型、操作系統(tǒng)版本、移動設(shè)備廠商、SDK版本信息，從而能夠判斷崩潰現(xiàn)象的發(fā)生是否由于硬件不兼容而導(dǎo)致;2)移動設(shè)備的運行時信息:移動設(shè)備的總CPU使用率、內(nèi)存占用率、溫度以及該應(yīng)用的CPU占用率、內(nèi)存占用率，從而能夠斷崩潰現(xiàn)象的發(fā)生是否由于移動設(shè)備性能原因或者應(yīng)用消耗設(shè)備資源過大而導(dǎo)致;3)異常堆棧的具體信息，幫助開發(fā)者判斷崩潰現(xiàn)象是否由于代碼出現(xiàn)Bug而導(dǎo)致，并提供線索定位解決異常;最后通過收集并歸類崩潰類型，提供錯誤管理及數(shù)據(jù)分析工具，從而提高解決崩潰問題的效率；
[0009]3)關(guān)鍵路徑轉(zhuǎn)化率分析
[0010]關(guān)鍵路徑轉(zhuǎn)化率分析使用漏斗模型進行建模，幫助開發(fā)商確定某個流程的設(shè)計是否合理，各步驟間的組織是否存在優(yōu)化的空間；假設(shè)漏斗定義的關(guān)鍵路徑是A-B-C-D-E，則如下:
[00?1 ] ①用戶完成了 A-B-C-D-E，那么認為這個用戶成功完成了 A-B_C-D_E;
[0012]②用戶完成了A-B-C-F-D-E，那么認為這個用戶成功完成了A-B-C-D-E，只不過是按松散的順序完成的；
[0013]③用戶完成了A-B-C-E，那么認為這個用戶成功完成了 A-B-C和一次E;
[0014]④用戶完成了 A-B-C-A-B-C-D-D-E，那么認為這個用戶成功完成了一次A-B-C-D-E，完成了一次 A-B-C-D;
[0015]⑤用戶完成了 A-A-B-B-C-C-D-D-E-E，那么認為這個用戶成功完成了兩次A-B-C-D-E ；
[0016]⑥用戶完成了 A-A-B-B-C-D-D-E-E，那么認為這個用戶成功完成了一次A-B-C-D-E，完成了一次A-B和一次D-E;
[0017]⑦用戶完成了 A-B-C-B-A-A-B-C-D-D-E，那么會認為這個用戶成功完成了一次A-B-C-D-E，完成了一次 A-B-C-D，和一次 A，一次 B ；
[0018]采用上述模型能夠分析得到移動應(yīng)用各頁面之間的轉(zhuǎn)化率，通過自定義關(guān)鍵路徑，就能夠得到該關(guān)鍵路徑各頁面之間的轉(zhuǎn)化率；
[0019]4)頻繁序列挖掘
[°02°] 采用MFSGrowth方法進行用戶數(shù)據(jù)的頻繁序列挖掘，該方法以FPTree和TriedTree算法為基礎(chǔ);其中，將MFSGrowth方法用于頻繁序列挖掘有以下兩個步驟:
[0021]4.1)生成MFSTree;
[0022]4.2)生成以某個頻繁項為根節(jié)點的InvTree;
[0023]5)聚類分析
[0024]用戶聚類根據(jù)用戶的使用行為，生成相應(yīng)特征并聚類，通過用戶聚類能夠幫助開發(fā)商了解各用戶群體的整體使用情況，并根據(jù)各用戶群體的使用規(guī)律提供個性化服務(wù)；
[0025]采用雙層聚類算法實現(xiàn)對用戶使用行為的聚類分析:
[0026]第一層聚類即基于序列相似度的聚類DBScan:該層主要使用DBScan聚類算法，基于用戶的訪問序列以及訪問時間的相似度，對用戶會話進行聚類，得到的結(jié)果為多個序列類集；
[0027]第二層聚類即基于用戶行為相似度的聚類k-means:該層主要使用k-means聚類算法，在第一層聚類的結(jié)果上根據(jù)用戶在每個序列類集中的使用比例對用戶進行聚類。
[0028]DBScan是一種基于密度的聚類算法，它有一個核心點的概念:如果一個點，在距它Eps的范圍內(nèi)有不少于MinPts個點，則該點就是核心點，核心和它Eps范圍內(nèi)的鄰居形成一個簇，在一個簇內(nèi)如果出現(xiàn)多個點都是核心點，則以這些核心點為中心的簇要合并。
[0029]所述的Kmeans算法，包括以下步驟:
[0030]第一步:隨機取K個中心點；
[0031]第二步:所有點分別求到這K個中心點的距離，并將其劃分到最近的中心點的簇中；
[0032]第三步:根據(jù)每個簇中的樣本點更新K個中心點；
[0033]第四步:反復(fù)執(zhí)行第二、第三步，直到K個中心點都不發(fā)生移動。
[0034]本發(fā)明與現(xiàn)有技術(shù)相比，具有如下優(yōu)點與有益效果:
[0035]1、本發(fā)明從用戶行為分析方面對移動應(yīng)用的質(zhì)量保證提出了有效的解決方案，為提高軟件質(zhì)量，改善用戶體驗提供了有效保障。
[0036]2、在用戶行為分析方面提供用戶行為挖掘功能幫助移動應(yīng)用開發(fā)商了解App的整體運營情況及隱藏在大量用戶行為數(shù)據(jù)背后的規(guī)則、模式、規(guī)律，從而定制相應(yīng)的改進策略。
[0037]3、本發(fā)明采用的基于FPTree算法和TriedTree算法實現(xiàn)的極大頻繁序列挖掘方法能夠根據(jù)用戶行為數(shù)據(jù)生成用戶頻繁訪問的序列，為運營人員推廣移動應(yīng)用和開發(fā)人員提高用戶體驗提供了有價值的參考數(shù)據(jù)。
【附圖說明】
[0038]圖1為基于程序插粧的用戶行為數(shù)據(jù)收集框架圖。
[0039]圖2為電商購物流程漏斗模型。
[0040]圖3為關(guān)鍵路徑轉(zhuǎn)化率模型。
[0041 ]圖4為構(gòu)建的MFSTree ο
[0042]圖5為E的前序逆路徑。
[0043]圖6為D的前序逆路徑。
[0044]圖7為基于用戶序列相似度聚類(DBScan)。
[0045]圖8為基于用戶行為相似度聚類(Kmeans)。
【具體實施方式】
[0046]下面結(jié)合具體實施例對本發(fā)明作進一步說明。
[0047]本實施例所述的基于移動應(yīng)用的互聯(lián)網(wǎng)用戶數(shù)據(jù)分析方法，具體情況如下:
[0048](一)用戶行為數(shù)據(jù)采集
[0049]不同與Web日志的收集，移動應(yīng)用需要根據(jù)不同類型的操作系統(tǒng)設(shè)計不同的數(shù)據(jù)收集方法，如1S系統(tǒng)上使用Ob ject-C進行應(yīng)用開發(fā)，Ob ject-C是解釋型語言，可在應(yīng)用運行時做代碼的修改和熱替換，為原有的類與方法添加收據(jù)收集功能，Android系統(tǒng)可使用AOP思想來實現(xiàn)用戶數(shù)據(jù)的收集。Android的上層開發(fā)采用的是Java語言,Android應(yīng)用開發(fā)需要先將Java語言源文件先編譯成字碼文件。本發(fā)明將利用Java字節(jié)碼特性，采用靜態(tài)插粧技術(shù)，設(shè)計一套統(tǒng)一的數(shù)據(jù)收集方案。如圖1所示，在保證移動應(yīng)用源代碼的邏輯完整性的基礎(chǔ)上，在程序中插入一些可定制的數(shù)據(jù)收集代碼，這部分工作在編譯期完成，不污染源代碼，通過觸發(fā)插粧代碼的執(zhí)行來獲取程序運行的相關(guān)數(shù)據(jù)，并通過自定義事件和自定義指標的跟蹤和分析，獲得程序的控制流和數(shù)據(jù)流信息，從而實現(xiàn)數(shù)據(jù)收集的目的。本平臺主要收集應(yīng)用的新增用戶，活躍用戶，啟動次數(shù)，版本分布，用戶地域分布等行業(yè)指標數(shù)據(jù)，以及每個用戶在使用移動應(yīng)用時頁面的瀏覽順序，每個頁面的平均加載時間，逗留時間等用戶行為數(shù)據(jù)。
[0050](二)崩潰分析
[0051]移動應(yīng)用在發(fā)生崩潰或者閃退現(xiàn)象時會拋出異常，異常類型主要有兩種:可檢測異常和不可檢測異常，開發(fā)者意識到前者可能會發(fā)生異常從而使用異常捕獲機制來顯示的捕獲，而后者是開發(fā)者未意識到的異常，它通常在程序發(fā)布后才會出現(xiàn)從而導(dǎo)致程序崩潰、停止。本發(fā)明深入研究各主流操作系統(tǒng)不可檢測異常的調(diào)用過程和工作原理，通過重寫操作系統(tǒng)底層的異常捕獲機制來實現(xiàn)個性化的崩潰信息收集和分析，從而達到在移動應(yīng)用發(fā)生異常時能實時收集開發(fā)者定制的異常信息，包括I)移動設(shè)備的硬件信息:操作系統(tǒng)類型、操作系統(tǒng)版本、移動設(shè)備廠商、SDK版本等信息，從而可以判斷崩潰現(xiàn)象的發(fā)生是否由于硬件不兼容而導(dǎo)致;2)移動設(shè)備的運行時信息:移動設(shè)備的總CPU使用率、內(nèi)存占用率、溫度以及該應(yīng)用的CPU占用率、內(nèi)存占用率等，從而可以判斷崩潰現(xiàn)象的發(fā)生是否由于移動設(shè)備性能原因或者應(yīng)用消耗設(shè)備資源過大而導(dǎo)致;3)異常堆棧的具體信息，幫助開發(fā)者判斷崩潰現(xiàn)象是否由于代碼出現(xiàn)Bug而導(dǎo)致，并提供更多線索定位解決異常。最后通過收集并歸類崩潰類型，提供錯誤管理及數(shù)據(jù)分析工具，從而提高解決崩潰問題的效率。
[0052](三)關(guān)鍵路徑轉(zhuǎn)化率
[0053]關(guān)鍵路徑轉(zhuǎn)化率分析使用漏斗模型進行建模，幫助開發(fā)商確定某個流程的設(shè)計是否合理，各步驟間的組織是否存在優(yōu)化的空間。
[0054]漏斗模型如圖2所示(以電商購物流程示例):
[0055]1.加入購物車一>2.提交購物車一>3.創(chuàng)建訂單一>4.支付訂單一>5.完成訂單。
[0056]假設(shè)漏斗定義的關(guān)鍵路徑是A-B-C-D-E:
[0057](I)用戶完成了 A-B-C-D-E，那么認為這個用戶成功完成了 A-B-C-D-E。
[0058](2)用戶完成了A-B-C-F-D-E，那么認為這個用戶成功完成了A-B-C-D-E，只不過是按松散的順序完成的。
[0059 ] (3)用戶完成了 A-B-C-E，那么認為這個用戶成功完成了 A_B_C和一次E。
[0060 ] (4)用戶完成了 A-B-C-A-B-C-D-D-E，那么認為這個用戶成功完成了一次A-B-C-D-E，完成了一次 A-B-C-D。
[0061 ] (5)用戶完成了 A-A-B-B-C-C-D-D-E-E，那么認為這個用戶成功完成了兩次A-B-C-D-E0
[0062 ] (6)用戶完成了 A-A-B-B-C-D-D-E-E，那么認為這個用戶成功完成了一次A-B-C-D-E，完成了一次A-B和一次D-E。
[0063](7)用戶完成了 A-B-C-B-A-A-B-C-D-D-E，那么會認為這個用戶成功完成了一次A-B-C-D-E，完成了一次 A-B-C-D，和一次 A，一次 B。
[0064]采用該模型可以分析得到移動應(yīng)用各頁面之間的轉(zhuǎn)化率，通過自定義關(guān)鍵路徑，可以得到該關(guān)鍵路徑各頁面之間的轉(zhuǎn)化率。如定義一個APPStart—Main—NewsDetail —null的關(guān)鍵路徑，得到如圖3所示的轉(zhuǎn)化率模型。
[0065](四)頻繁序列挖掘
[0066]頻繁序列挖掘借鑒FPGrowth和TriedTree的思想，其中，F(xiàn)PGrowth算法是用于挖掘頻繁項集的算法，它利用了一種特殊的數(shù)據(jù)結(jié)構(gòu)，加快了整個挖掘過程;TriedTree是哈希樹的變種，它利用字符串的公共前綴來減少查詢時間，最大限度地減少無謂的字符串比較，查詢效率比哈希樹高;通過結(jié)合FPGr ο wth和Tr i e dTr e e提出一種高效的頻繁序列挖掘算法，其挖掘結(jié)果可以反映用戶的一般使用流程和瀏覽興趣，幫助開發(fā)者改善App頁面的組織結(jié)構(gòu)。
[0067]本發(fā)明采用MFSGrowth方法進行用戶數(shù)據(jù)的頻繁序列挖掘。該方法以FPTree和TriedTree算法為基礎(chǔ)。
[0068]將MFSGrowth方法用于頻繁序列挖掘有以下兩個步驟:
[0069]I)生成MFSTree，如圖4所示；
[0070]數(shù)據(jù)集如下(3條訪問記錄)，假設(shè)支持度閾值為2:
[0071]Sequencel:A,B,D,E
[0072]Sequence2:A,B,D,F
[0073]Sequence3:C,D,E
[0074]2)生成以某個頻繁項為根節(jié)點的InvTree。以節(jié)點D和E為例，如圖5和圖6所示。
[0075](五)聚類分析
[0076]用戶聚類根據(jù)用戶的使用行為，生成相應(yīng)特征并聚類，通過用戶聚類可以幫助開發(fā)商更好地了解各用戶群體的整體使用情況，并根據(jù)各用戶群體的使用規(guī)律提供個性化服務(wù)。
[0077]本發(fā)明采用雙層聚類算法實現(xiàn)對用戶使用行為的聚類分析。
[0078]第一層聚類(基于序列相似度的聚類):該層主要使用DBScan聚類算法，基于用戶的訪問序列以及訪問時間的相似度，對用戶會話進行聚類，得到的結(jié)果為多個序列類集。
[0079]DBScan是一種基于密度的聚類算法，它有一個核心點的概念:如圖7所示，如果一個點，在距它Eps的范圍內(nèi)有不少于MinPts個點，則該點就是核心點。核心和它Eps范圍內(nèi)的鄰居形成一個簇。在一個簇內(nèi)如果出現(xiàn)多個點都是核心點，則以這些核心點為中心的簇要合并。
[0080]第二層聚類(基于用戶行為相似度的聚類):該層主要使用k-means聚類算法，在第一層聚類的結(jié)果上根據(jù)用戶在每個序列類集中的使用比例對用戶進行聚類。
[00811 如圖8所示，Kmeans算法步驟如下:
[0082]第一步:隨機取K個中心點。
[0083]第二步:所有點分別求到這K個中心點的距離，并將其劃分到最近的中心點的簇中。第三步:根據(jù)每個簇中的樣本點更新K個中心點。
[0084]第四步:反復(fù)執(zhí)行第二、第三步，直到K個中心點都不發(fā)生移動。
[0085]以上所述實施例只為本發(fā)明之較佳實施例，并非以此限制本發(fā)明的實施范圍，故凡依本發(fā)明之形狀、原理所作的變化，均應(yīng)涵蓋在本發(fā)明的保護范圍內(nèi)。
【主權(quán)項】
1.一種基于移動應(yīng)用的互聯(lián)網(wǎng)用戶數(shù)據(jù)分析方法，其特征在于，包括以下步驟: 1)用戶行為數(shù)據(jù)采集在保證移動應(yīng)用源代碼的邏輯完整性的基礎(chǔ)上，在程序中插入可定制的數(shù)據(jù)收集代碼，這部分工作在編譯期完成，不污染源代碼，通過觸發(fā)插粧代碼的執(zhí)行來獲取程序運行的相關(guān)數(shù)據(jù)，并通過自定義事件和自定義指標的跟蹤和分析，獲得程序的控制流和數(shù)據(jù)流信息，從而實現(xiàn)數(shù)據(jù)收集的目的；其中，主要收集應(yīng)用的新增用戶、活躍用戶、啟動次數(shù)、版本分布、用戶地域分布這些行業(yè)指標數(shù)據(jù)，以及每個用戶在使用移動應(yīng)用時頁面的瀏覽順序，每個頁面的平均加載時間、逗留時間這些用戶行為數(shù)據(jù)； 2)崩潰分析研究各主流操作系統(tǒng)不可檢測異常的調(diào)用過程和工作原理，通過重寫操作系統(tǒng)底層的異常捕獲機制來實現(xiàn)個性化的崩潰信息收集和分析，從而達到在移動應(yīng)用發(fā)生異常時能實時收集開發(fā)者定制的異常信息，包括:I)移動設(shè)備的硬件信息:操作系統(tǒng)類型、操作系統(tǒng)版本、移動設(shè)備廠商、SDK版本信息，從而能夠判斷崩潰現(xiàn)象的發(fā)生是否由于硬件不兼容而導(dǎo)致;2)移動設(shè)備的運行時信息:移動設(shè)備的總CHJ使用率、內(nèi)存占用率、溫度以及該應(yīng)用的CPU占用率、內(nèi)存占用率，從而能夠斷崩潰現(xiàn)象的發(fā)生是否由于移動設(shè)備性能原因或者應(yīng)用消耗設(shè)備資源過大而導(dǎo)致;3)異常堆棧的具體信息，幫助開發(fā)者判斷崩潰現(xiàn)象是否由于代碼出現(xiàn)Bug而導(dǎo)致，并提供線索定位解決異常;最后通過收集并歸類崩潰類型，提供錯誤管理及數(shù)據(jù)分析工具，從而提高解決崩潰問題的效率； 3)關(guān)鍵路徑轉(zhuǎn)化率分析關(guān)鍵路徑轉(zhuǎn)化率分析使用漏斗模型進行建模，幫助開發(fā)商確定某個流程的設(shè)計是否合理，各步驟間的組織是否存在優(yōu)化的空間;假設(shè)漏斗定義的關(guān)鍵路徑是A-B-C-D-E，則如下: ①用戶完成了A-B-C-D-E，那么認為這個用戶成功完成了 A-B-C-D-E; ②用戶完成了A-B-C-F-D-E，那么認為這個用戶成功完成了A-B-C-D-E，只不過是按松散的順序完成的； ③用戶完成了A-B-C-E，那么認為這個用戶成功完成了 A-B-C和一次E; ④用戶完成了A-B-C-A-B-C-D-D-E，那么認為這個用戶成功完成了一次A-B-C-D-E，完成了一次 A-B-C-D; ⑤用戶完成了A-A-B-B-C-C-D-D-E-E，那么認為這個用戶成功完成了兩次A-B-C-D-E ； ⑥用戶完成了A-A-B-B-C-D-D-E-E，那么認為這個用戶成功完成了一次A-B-C-D-E，完成了一次A-B和一次D-E; ⑦用戶完成了A-B-C-B-A-A-B-C-D-D-E，那么會認為這個用戶成功完成了一次A-B-C-D-E，完成了一次 A-B-C-D，和一次 A，一次 B ；采用上述模型能夠分析得到移動應(yīng)用各頁面之間的轉(zhuǎn)化率，通過自定義關(guān)鍵路徑，就能夠得到該關(guān)鍵路徑各頁面之間的轉(zhuǎn)化率； 4)頻繁序列挖掘采用MFSGrowth方法進行用戶數(shù)據(jù)的頻繁序列挖掘，該方法以FPTree和TriedTree算法為基礎(chǔ);其中，將MFSGrowth方法用于頻繁序列挖掘有以下兩個步驟: 4.1)生成MFSTree; 4.2)生成以某個頻繁項為根節(jié)點的InvTree； 5)聚類分析用戶聚類根據(jù)用戶的使用行為，生成相應(yīng)特征并聚類，通過用戶聚類能夠幫助開發(fā)商了解各用戶群體的整體使用情況，并根據(jù)各用戶群體的使用規(guī)律提供個性化服務(wù)；采用雙層聚類算法實現(xiàn)對用戶使用行為的聚類分析: 第一層聚類即基于序列相似度的聚類DBScan:該層主要使用DBScan聚類算法，基于用戶的訪問序列以及訪問時間的相似度，對用戶會話進行聚類，得到的結(jié)果為多個序列類集；第二層聚類即基于用戶行為相似度的聚類k-means:該層主要使用k-means聚類算法，在第一層聚類的結(jié)果上根據(jù)用戶在每個序列類集中的使用比例對用戶進行聚類。2.根據(jù)權(quán)利要求1所述的一種基于移動應(yīng)用的互聯(lián)網(wǎng)用戶數(shù)據(jù)分析方法，其特征在于:DBScan是一種基于密度的聚類算法，它有一個核心點的概念:如果一個點，在距它Eps的范圍內(nèi)有不少于MinPts個點，則該點就是核心點，核心和它Eps范圍內(nèi)的鄰居形成一個簇，在一個簇內(nèi)如果出現(xiàn)多個點都是核心點，則以這些核心點為中心的簇要合并。3.根據(jù)權(quán)利要求1所述的一種基于移動應(yīng)用的互聯(lián)網(wǎng)用戶數(shù)據(jù)分析方法，其特征在于，所述的Kmeans算法，包括以下步驟: 第一步:隨機取K個中心點；第二步:所有點分別求到這K個中心點的距離，并將其劃分到最近的中心點的簇中；第三步:根據(jù)每個簇中的樣本點更新K個中心點；第四步:反復(fù)執(zhí)行第二、第三步，直到K個中心點都不發(fā)生移動。
【文檔編號】G06Q30/02GK105959372SQ201610298884
【公開日】2016年9月21日
【申請日】2016年5月6日
【發(fā)明人】陸璐, 黎燦燦
【申請人】華南理工大學(xué)

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：陸璐;黎燦燦;
技術(shù)所有人：華南理工大學(xué);
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機電一體化產(chǎn)品開發(fā) 4.機械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設(shè)計 2.汽車檢測系統(tǒng)設(shè)計 3.汽車電子控制系統(tǒng)設(shè)計
4、畢老師：機構(gòu)動力學(xué)與控制
5、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

互聯(lián)網(wǎng)用戶分析相關(guān)技術(shù)

移動互聯(lián)網(wǎng)用戶總數(shù)相關(guān)技術(shù)

大數(shù)據(jù)分析方法與應(yīng)用相關(guān)技術(shù)

統(tǒng)計分析方法及應(yīng)用相關(guān)技術(shù)

日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

一種基于移動應(yīng)用的互聯(lián)網(wǎng)用戶數(shù)據(jù)分析方法