本發(fā)明屬于社交網(wǎng)絡(luò)分析領(lǐng)域,具體涉及一種基于動(dòng)態(tài)群體特征的引導(dǎo)型話題檢測方法。
背景技術(shù):
1、引導(dǎo)性話題的檢測變得尤為重要,它涉及到如何準(zhǔn)確地識(shí)別和跟蹤那些具有引導(dǎo)輿論潛力的關(guān)鍵話題。
2、近年來,大批學(xué)者在社交網(wǎng)絡(luò)領(lǐng)域進(jìn)行研究并取得了相當(dāng)?shù)某删汀T谝酝鶎χ{言檢測的研究中,通過觀察引導(dǎo)型話題傳播過程中的用戶的文本特征以及用戶特征在時(shí)間軸上的變化趨勢進(jìn)行檢測。并沒有考慮話題中群體結(jié)構(gòu)特征和情感特征變化對引導(dǎo)型話題檢測中的影響。因此,針對引導(dǎo)型話題空間中的群體特征的變化開展研究,能夠更高效的實(shí)現(xiàn)對引導(dǎo)型話題的檢測。
3、隨著社交網(wǎng)絡(luò)數(shù)據(jù)量的不斷擴(kuò)大和深度學(xué)習(xí)技術(shù)的逐漸成熟,神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)等非線性模型逐步成為分析復(fù)雜網(wǎng)絡(luò)的主流選擇。choi等人(choi?j,ko?t,choi?y,etal.dynamic?graph?convolutional?networks?with?attention?mechanism?for?rumordetection?on?social?media[j].plos?one,2021,16(8):e0256039.)提出一種基于注意力機(jī)制的動(dòng)態(tài)圖卷積網(wǎng)絡(luò)模型dygcn進(jìn)行謠言檢測,有效地將謠言的內(nèi)容與傳播結(jié)構(gòu)結(jié)合在一起提取特征,同時(shí)也捕捉到了謠言傳播的動(dòng)態(tài)信息。該論文說明了利用話題的內(nèi)容特征和傳播結(jié)構(gòu)可以有效地對引導(dǎo)型話題進(jìn)行檢測,受該篇論文和群體劃分算法的啟發(fā),本發(fā)明提出一種基于群體特征的引導(dǎo)型話題檢測方法,將群體的情感特征和結(jié)構(gòu)特征結(jié)合起來,通過gru網(wǎng)絡(luò)捕獲話題演化過程中群體特征的變化進(jìn)而檢測引導(dǎo)型話題。
4、綜上所述,現(xiàn)有技術(shù)中存在以下問題:
5、問題1:引導(dǎo)型話題群體的隱蔽性。由于用戶的興趣和偏好具有獨(dú)特性,以及用戶的個(gè)人的隱性偏好和情感等多種因素的影響,引導(dǎo)型話題群體一般具有隱蔽性。
6、問題2:引導(dǎo)性話題群體特征的動(dòng)態(tài)性,由于話題演化過程中用戶所屬群體不斷變化,引導(dǎo)型話題群體特征一般具有動(dòng)態(tài)性。
7、問題3:引導(dǎo)性話題群體興趣量化問題。話題參與群體的情感傾向是解決引導(dǎo)型話題檢測問題的核心。因此量化細(xì)粒度的用戶情感傾向,進(jìn)而得到各時(shí)刻的群體興趣傾向?qū)τ诶胓ru網(wǎng)絡(luò)進(jìn)行檢測引導(dǎo)型話題顯得尤為重要。
技術(shù)實(shí)現(xiàn)思路
1、為了解決背景技術(shù)中存在的問題,本發(fā)明提供一種基于動(dòng)態(tài)群體特征的引導(dǎo)型話題檢測方法,具體包括以下步驟:
2、s1:利用公開的數(shù)據(jù)集網(wǎng)站或社交網(wǎng)絡(luò)提供的api接口,全面收集話題數(shù)據(jù),話題數(shù)據(jù)包括用戶評論、詳細(xì)的用戶信息數(shù)據(jù)以及用戶之間的交互關(guān)系;
3、s2:從話題數(shù)據(jù)中提取相關(guān)屬性,相關(guān)屬性包括話題傳播網(wǎng)絡(luò)、用戶基礎(chǔ)屬性、用戶交互度、內(nèi)部驅(qū)動(dòng)因素和外部驅(qū)動(dòng)因素;
4、s3:采用基于用戶交互度與用戶屬性相似性的louvain隱性社群挖掘方法,更新話題傳播網(wǎng)絡(luò)的加權(quán)鄰接矩陣,得到各時(shí)刻話題的用戶群體集合;
5、s4:采用ig2vec表示學(xué)習(xí)算法進(jìn)行從話題爆發(fā)階段開始各時(shí)刻的用戶特征表示;
6、s5:根據(jù)基于博弈理論得到的情感互影響力模型量化情感互影響力,通過情感互影響力對用戶的情感進(jìn)行修正,挖掘出用戶的真實(shí)情感,進(jìn)而根據(jù)群體劃分的結(jié)果得到話題群體的情感特征表示;
7、s6:通過gru網(wǎng)絡(luò)捕捉各時(shí)刻融合后的話題群體特征的變化,通過全連接層后利用softmax函數(shù)將輸出轉(zhuǎn)換為兩個(gè)類別的概率值,將兩個(gè)類別的最大概率值對應(yīng)的類別作為預(yù)測結(jié)果。
8、在話題爆發(fā)期間,網(wǎng)絡(luò)中的用戶數(shù)量激增,如何高效地對用戶群體進(jìn)行劃分以檢測引導(dǎo)型話題,成為了一個(gè)亟待解決的問題。本發(fā)明至少具有以下有益效果:
9、1、本發(fā)明提出了一種基于用戶交互度與用戶屬性相似性的louvain隱性社群挖掘方法,該方法通過更新加權(quán)鄰接矩陣,能夠更全面地評估節(jié)點(diǎn)間的連接強(qiáng)度和屬性相似性,從而實(shí)現(xiàn)更為精確的群體劃分,顯著提升了話題檢測的效率與準(zhǔn)確性。
10、2、在話題傳播的過程中,用戶、消息、網(wǎng)絡(luò)等實(shí)體間存在著復(fù)雜多變的關(guān)系,這給特征的提取與簡化帶來了挑戰(zhàn)。為了有效應(yīng)對這一挑戰(zhàn),本發(fā)明創(chuàng)新性地提出了一種基于前驅(qū)話題表示的話題迭代表示方法(it2vec)。該方法充分考慮了當(dāng)前話題與前驅(qū)話題之間的聯(lián)系與差異,將衍生話題的特征空間低秩矢量化,極大地豐富了話題的特征表達(dá),為話題的檢測與分析提供了有力的支持。
11、3、此外,針對群體興趣的量化問題,本發(fā)明引入了博弈理論和多元線性回歸算法,構(gòu)建了一個(gè)群體興趣矩陣,并將其融入話題特征中。這一創(chuàng)新方法不僅實(shí)現(xiàn)了對群體興趣的精準(zhǔn)量化,還提高了話題分析的深度與廣度;同時(shí),考慮到話題傳播周期的時(shí)效性,本發(fā)明對話題數(shù)據(jù)進(jìn)行了時(shí)間切片處理,進(jìn)一步提出了引導(dǎo)型話題模型,為話題的實(shí)時(shí)監(jiān)測與預(yù)警提供了有力的技術(shù)支撐。
1.一種基于動(dòng)態(tài)群體特征的引導(dǎo)型話題檢測方法,其特征在于,具體包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種基于動(dòng)態(tài)群體特征的引導(dǎo)型話題檢測方法,其特征在于,更新話題傳播網(wǎng)絡(luò)的加權(quán)鄰接矩陣的過程包括以下步驟:
3.根據(jù)權(quán)利要求2所述的一種基于動(dòng)態(tài)群體特征的引導(dǎo)型話題檢測方法,其特征在于,采用基于用戶交互度與用戶屬性相似性的louvain隱性社群挖掘方法得到各時(shí)刻話題的用戶群體集合的過程包括:
4.根據(jù)權(quán)利要求2所述的一種基于動(dòng)態(tài)群體特征的引導(dǎo)型話題檢測方法,其特征在于,在話題的演化過程中時(shí)刻t用戶i與用戶j之間的交互程度userinteract(ui,uj,t)表示為:
5.根據(jù)權(quán)利要求1所述的一種基于動(dòng)態(tài)群體特征的引導(dǎo)型話題檢測方法,其特征在于,獲取t時(shí)刻的話題群體的低秩矢量化特征表示的過程包括以下步驟:
6.根據(jù)權(quán)利要求5所述的一種基于動(dòng)態(tài)群體特征的引導(dǎo)型話題檢測方法,其特征在于,進(jìn)行隨機(jī)游走的過程中,從用戶i游走到用戶j的概率表示為:
7.根據(jù)權(quán)利要求5所述的一種基于動(dòng)態(tài)群體特征的引導(dǎo)型話題檢測方法,其特征在于,每個(gè)用戶節(jié)點(diǎn)的向量表示根據(jù)當(dāng)前用戶嵌入向量與前一時(shí)刻的用戶嵌入向量基于打分函數(shù)和softmax函數(shù)進(jìn)行更新,更新過程包括:
8.根據(jù)權(quán)利要求1所述的一種基于動(dòng)態(tài)群體特征的引導(dǎo)型話題檢測方法,其特征在于,根據(jù)基于博弈理論得到的情感互影響力模型量化用戶情感,量化的積極情感影響力、消極情感影響力以及無情感傾向影響力分別表示為:
9.根據(jù)權(quán)利要求8所述的一種基于動(dòng)態(tài)群體特征的引導(dǎo)型話題檢測方法,其特征在于,t時(shí)刻用戶i的積極、消極以及無情感影響力函數(shù)分別表示為:
10.根據(jù)權(quán)利要求5所述的一種基于動(dòng)態(tài)群體特征的引導(dǎo)型話題檢測方法,其特征在于,t時(shí)刻用戶i基于用戶評論的文本特征的情感傾向?yàn)閜的內(nèi)部驅(qū)動(dòng)因素、外部驅(qū)動(dòng)因素分別表示為: