本發(fā)明涉及數(shù)據(jù)處理,尤其涉及一種多平臺社交媒體互動消息分級處理方法、裝置及電子設(shè)備。
背景技術(shù):
1、社交媒體互動消息是指用戶在社交媒體平臺上進行交流和互動的各種形式的信息。這些消息可以是文字、圖片、視頻或其他媒體格式,通常用于與其他用戶建立聯(lián)系、分享觀點或參與討論。
2、社交媒體平臺上的互動消息包括但不限于以下幾種類型:
3、1.評論:用戶可以在帖子下面留下評論,表達自己的看法或提出問題。
4、2.點贊:用戶可以通過點擊“贊”按鈕或者選擇一個表情反應(yīng)來表達對某條帖子的態(tài)度或情感。
5、3.分享/轉(zhuǎn)發(fā):用戶可以將內(nèi)容分享到自己的頁面或轉(zhuǎn)發(fā)給其他用戶。
6、4.私信/直接消息:用戶之間可以直接發(fā)送私密的消息進行一對一的溝通。
7、5.標簽/提及:通過使用@符號加上用戶名的方式,用戶可以在帖子中提到其他用戶。
8、6.直播互動:在直播過程中,觀眾可以通過發(fā)送實時評論與主播互動。
9、7.調(diào)查/投票:創(chuàng)建者可以發(fā)起投票,讓用戶參與并表達意見。
10、這些互動方式不僅增強了用戶之間的交流,也幫助社交媒體平臺成為了一個充滿活力的社區(qū)。
11、現(xiàn)有技術(shù)在處理戶型消息的過程中,存在如下問題:
12、1.互動消息分平臺處理,擴展性差:不同社交媒體平臺的互動消息因數(shù)據(jù)結(jié)構(gòu)、采集方式不同,導致每個平臺都需要單獨處理,當新增平臺時,開發(fā)工作量大,擴展性差,成本高。
13、2.互動消息處理效率低,處理不及時:社交媒體賬號產(chǎn)出的大量互動消息,按時間排序全部由人工處理,無法區(qū)分優(yōu)先級,消耗大量的人力和時間處理不重要不緊急的互動內(nèi)容,而重要緊急的內(nèi)容不能得到及時處理。
14、3.自動回復內(nèi)容模板,用戶體驗差:基于互動消息中的關(guān)鍵詞觸發(fā)的自動回復模板消息,無法以精準的內(nèi)容與用戶互動,答非所問,導致用戶體驗差。
15、上述問題成為需要解決的技術(shù)問題。
技術(shù)實現(xiàn)思路
1、有鑒于此,本發(fā)明實施例提供一種多平臺社交媒體互動消息分級處理方法、裝置及電子設(shè)備,至少部分解決現(xiàn)有技術(shù)中存在的問題。
2、第一方面,本發(fā)明實施例提供了一種多平臺社交媒體互動消息分級處理方法,包括:
3、實時采集t時間段內(nèi)多個社交媒體平臺的互動消息,形成互動消息集合c(t);
4、對所述互動消息集合c(t)進行標準化處理,得到標準數(shù)據(jù)集s(c(t));
5、針對標準數(shù)據(jù)集s(c(t))中的每條消息m∈s(c(t))進行特征提取,得到特征向量f(m)=[ge,ag,fl,lc,ln,em,se],所述特征向量f(m)包括用戶性別ge、用戶年齡ag、關(guān)注用戶數(shù)fl、地域信息lc、語言信息ln、消息評價值em和消息語義se;
6、通過優(yōu)先級計算函數(shù)g(),對所述特征向量f(m)進行優(yōu)先級計算,得到消息m的優(yōu)先級值p,p=g(f(m));
7、當所述優(yōu)先級值p小于閾值p0時,生成所述消息m所對應(yīng)的回復建議信息r1(p),當所述優(yōu)先級值p大于等于所述閾值p0時,生成所述消息m所對應(yīng)的自動回復信息r2(p);
8、利用界面顯示函數(shù)u對回復建議信息r1(p)和自動回復信息r2(p)進行處理,并將處理后的結(jié)果u(r1(p),r2(p))顯示給預設(shè)界面上。
9、根據(jù)本公開實施例的一種具體實現(xiàn)方式,所述實時采集t時間段內(nèi)多個社交媒體平臺的互動消息,包括:
10、確定包含所有要采集數(shù)據(jù)的社交媒體平臺的集合p;
11、對于每一個平臺p∈p,定義采集函數(shù)cp(t),采集函數(shù)cp(t)返回t時間內(nèi)從平臺p采集的所有消息;
12、將所有平臺采集的數(shù)據(jù)進行聚合,形成互動消息集合c(t)。
13、根據(jù)本公開實施例的一種具體實現(xiàn)方式,所述對所述互動消息集合c(t)進行標準化處理,得到標準數(shù)據(jù)集s(c(t)),包括:
14、定義n(v)為互動消息集合c(t)包含的字段v的數(shù)值,min(v)和max(v)分別為v的最小值和最大值,對互動消息集合c(t)進行數(shù)值轉(zhuǎn)換,得到標準化數(shù)值集合:
15、
16、定義c(m)為所述互動消息集合中消息m的類別字段,ec為c類別的編碼向量,對標準化數(shù)值集合進行編碼轉(zhuǎn)換,得到編碼向量集合:
17、;
18、定義z(v)為編碼向量集合中字段v的z分數(shù),μ(v)為v的均值,σ(v)為v的標準差,對編碼向量集合進行異常檢測,得到標準數(shù)據(jù)集s(c(t)):
19、
20、其中,τ是設(shè)定的閾值。
21、根據(jù)本公開實施例的一種具體實現(xiàn)方式,所述針對標準數(shù)據(jù)集s(c(t))中的每條消息m∈s(c(t))進行特征提取,得到特征向量f(m),包括:
22、設(shè)置評價分析模型sf,評價分析模型sf接受消息m作為輸入,并輸出一個評價極性p和評價強度s,評價極性p為正數(shù)或負數(shù),評價強度s是一個介于0和1之間的實數(shù),則消息m的消息評價值em(m)為:
23、em(m)=p(m)×s(m)。
24、根據(jù)本公開實施例的一種具體實現(xiàn)方式,所述針對標準數(shù)據(jù)集s(c(t))中的每條消息m∈s(c(t))進行特征提取,得到特征向量f(m),還包括:
25、設(shè)置語義分析模型sy,語義分析模型sy接受消息m作為輸入,并輸出一個或多個語義類別的得分,每個語義類別yc都有一個得分sc,表示消息m與每個語義類別相關(guān)的程度,定義語義特征se為:
26、se(m)=s(m)=[s1,s2,…,sn]
27、其中,s(m)是一個向量,s(m)中的第i個元素si表示消息m與第i個語義類別的關(guān)聯(lián)度得分,n為語義類別的數(shù)目。
28、根據(jù)本公開實施例的一種具體實現(xiàn)方式,所述通過優(yōu)先級計算函數(shù)g(),對所述特征向量f(m)進行優(yōu)先級計算,得到消息m的優(yōu)先級值p,包括:
29、定義優(yōu)先級計算函數(shù)g:
30、
31、其中α、β、γ、δ、η、ζ、θ、κ、λi、是調(diào)整系數(shù),lni表示第i種語言的信息。
32、根據(jù)本公開實施例的一種具體實現(xiàn)方式,所述當所述優(yōu)先級值p小于閾值p0時,生成所述消息m所對應(yīng)的回復建議信息r1(p),包括:
33、定義回復建議信息生成公式:
34、r1(p)=d(m,p)
35、其中,p是消息參數(shù),包括消息m所對應(yīng)的上下文信息、對話歷史和用戶偏好,d是對話管理系統(tǒng),對話管理系統(tǒng)基于消息m和參數(shù)p生成回復建議信息;
36、對話管理系統(tǒng)從消息m提取關(guān)鍵信息和意圖,根據(jù)參數(shù)p中包含的上下文信息,理解當前對話的背景,基于語義理解和上下文建模的結(jié)果,生成回復建議。
37、根據(jù)本公開實施例的一種具體實現(xiàn)方式,所述利用界面顯示函數(shù)u對回復建議信息r1(p)和自動回復信息r2(p)進行處理,包括:
38、所述界面顯示函數(shù)u將回復建議信息r1(p)展示給用戶,并接受用戶對回復建議信息r1(p)的修改及確認,并在用戶完成修改及確認之后,將用戶確認的消息自動發(fā)送給目標社交媒體;
39、所述界面顯示函數(shù)u將自動回復信息r2(p)直接發(fā)送給目標社交媒體后,向用戶展示消息發(fā)送完成提示。
40、第二方面,本發(fā)明實施例提供了一種多平臺社交媒體互動消息分級處理裝置,包括:
41、采集模塊,實時采集t時間段內(nèi)多個社交媒體平臺的互動消息,形成互動消息集合c(t);
42、處理模塊,對所述互動消息集合c(t)進行標準化處理,得到標準數(shù)據(jù)集s(c(t));
43、提取模塊,針對標準數(shù)據(jù)集s(c(t))中的每條消息m∈s(c(t))進行特征提取,得到特征向量f(m)=[ge,ag,fl,lc,ln,em,se],所述特征向量f(m)包括用戶性別ge、用戶年齡ag、關(guān)注用戶數(shù)fl、地域信息lc、語言信息ln、消息評價值em和消息語義se;
44、計算模塊,通過優(yōu)先級計算函數(shù)g(),對所述特征向量f(m)進行優(yōu)先級計算,得到消息m的優(yōu)先級值p,p=g(f(m));
45、生成模塊,當所述優(yōu)先級值p小于閾值p0時,生成所述消息m所對應(yīng)的回復建議信息r1(p),當所述優(yōu)先級值p大于等于所述閾值p0時,生成所述消息m所對應(yīng)的自動回復信息r2(p);
46、顯示模塊,利用界面顯示函數(shù)u對回復建議信息r1(p)和自動回復信息r2(p)進行處理,并將處理后的結(jié)果u(r1(p),r2(p))顯示給預設(shè)界面上。
47、第三方面,本發(fā)明實施例還提供了一種電子設(shè)備,該電子設(shè)備包括:
48、至少一個處理器;以及,
49、與該至少一個處理器通信連接的存儲器;其中,
50、該存儲器存儲有可被該至少一個處理器執(zhí)行的指令,該指令被該至少一個處理器執(zhí)行,以使該至少一個處理器能夠執(zhí)行前述任第一方面或第一方面的任一實現(xiàn)方式中的多平臺社交媒體互動消息分級處理方法。
51、第四方面,本發(fā)明實施例還提供了一種非暫態(tài)計算機可讀存儲介質(zhì),該非暫態(tài)計算機可讀存儲介質(zhì)存儲計算機指令,該計算機指令用于使該計算機執(zhí)行前述第一方面或第一方面的任一實現(xiàn)方式中的多平臺社交媒體互動消息分級處理方法。
52、第五方面,本發(fā)明實施例還提供了一種計算機程序產(chǎn)品,該計算機程序產(chǎn)品包括存儲在非暫態(tài)計算機可讀存儲介質(zhì)上的計算程序,該計算機程序包括程序指令,當該程序指令被計算機執(zhí)行時,使該計算機執(zhí)行前述第一方面或第一方面的任一實現(xiàn)方式中的多平臺社交媒體互動消息分級處理方法。
53、本發(fā)明實施例中的多平臺社交媒體互動消息分級處理方案,包括:實時采集t時間段內(nèi)多個社交媒體平臺的互動消息,形成互動消息集合c(t);對所述互動消息集合c(t)進行標準化處理,得到標準數(shù)據(jù)集s(c(t));針對標準數(shù)據(jù)集s(c(t))中的每條消息m∈s(c(t))進行特征提取,得到特征向量f(m)=[ge,ag,fl,lc,ln,em,se],所述特征向量f(m)包括用戶性別ge、用戶年齡ag、關(guān)注用戶數(shù)fl、地域信息lc、語言信息ln、消息評價值em和消息語義se;通過優(yōu)先級計算函數(shù)g(),對所述特征向量f(m)進行優(yōu)先級計算,得到消息m的優(yōu)先級值p,p=g(f(m));當所述優(yōu)先級值p小于閾值p0時,生成所述消息m所對應(yīng)的回復建議信息r1(p),當所述優(yōu)先級值p大于等于所述閾值p0時,生成所述消息m所對應(yīng)的自動回復信息r2(p);利用界面顯示函數(shù)u對回復建議信息r1(p)和自動回復信息r2(p)進行處理,并將處理后的結(jié)果u(r1(p),r2(p))顯示給預設(shè)界面上。
54、本技術(shù)的方案,具有如下有益效果:
55、1)多平臺支持:能夠?qū)崟r采集多個社交媒體平臺的互動消息,確保數(shù)據(jù)的全面性和實時性。
56、2)數(shù)據(jù)標準化和規(guī)范化:對不同數(shù)據(jù)結(jié)構(gòu)的互動消息進行關(guān)鍵特征提取,統(tǒng)一數(shù)據(jù)格式,標準化處理,提高數(shù)據(jù)的一致性和可處理性。
57、3)提升管理效率:通過智能化處理和分級,自動回復內(nèi)容生成,提高消息處理的響應(yīng)速度,及時回復用戶,提升社交媒體社群管理的效率。
58、4)改善用戶體驗:通過自然語言算法識別互動用戶的特征,并進行理解語義,實現(xiàn)個性化互動和及時有效的回復,提升用戶滿意度和粘性。