本申請(qǐng)涉及人工智能,尤其涉及一種文本情感極性分類方法及裝置、可讀存儲(chǔ)介質(zhì)。
背景技術(shù):
1、文本情感分析是指利用自然語言處理和文本挖掘技術(shù),對(duì)帶有情感色彩的主觀性文本進(jìn)行分析、處理和抽取的過程,利用所抽取的情感特征對(duì)主觀性文本的情感極性為積極性還是消極性。
2、現(xiàn)有文本情感極性分類方法多采用串行結(jié)構(gòu)的混合神經(jīng)網(wǎng)絡(luò)模式進(jìn)行特征抽取,但串行結(jié)構(gòu)在特征傳遞的過程中特征損失問題會(huì)被放大,且訓(xùn)練過程更容易發(fā)生過擬合現(xiàn)象,并且多個(gè)神經(jīng)網(wǎng)絡(luò)特點(diǎn)不同,所抽取的特征類型也不同,采用串行結(jié)構(gòu)并不能將多種類型特征完全利用,導(dǎo)致文本情感極性分類結(jié)果的準(zhǔn)確率低。
技術(shù)實(shí)現(xiàn)思路
1、本申請(qǐng)實(shí)施例的目的是提供一種文本情感極性分類方法及裝置、可讀存儲(chǔ)介質(zhì),用以解決目前混合神經(jīng)網(wǎng)絡(luò)分類文本情感極性存在的準(zhǔn)確率低的問題。
2、為了解決上述技術(shù)問題,本說明書是這樣實(shí)現(xiàn)的:
3、第一方面,提供了一種文本情感極性分類方法,包括:
4、獲取主觀性文本對(duì)應(yīng)的詞向量矩陣;
5、基于所述詞向量矩陣和雙向循環(huán)門控單元gru網(wǎng)絡(luò),得到所述主觀性文本的全局上下文特征;
6、基于所述詞向量矩陣和寬動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)dcnn,得到所述主觀性文本的深度局部特征和邊緣信息;
7、通過將所述全局上下文特征、深度局部特征和邊緣信息進(jìn)行融合,得到融合特征;
8、基于所述融合特征和全連接層,確定所述主觀性文本的情感極性類型。
9、可選地,所述基于所述詞向量矩陣和雙向循環(huán)門控單元gru網(wǎng)絡(luò),得到所述主觀性文本的全局上下文特征,包括:
10、將所述詞向量矩陣輸入雙向gru網(wǎng)絡(luò);
11、經(jīng)所述雙向gru網(wǎng)絡(luò)的循環(huán)門控單元的前向編碼和后向編碼,得到包含所述主觀性文本的上文信息和下文信息的隱藏層;
12、通過從所述隱藏層提取上文信息和下文信息,得到所述主觀性文本的全局上下文特征。
13、可選地,所述雙向gru網(wǎng)絡(luò)包括第一層雙向gru網(wǎng)絡(luò)和第二層雙向gru網(wǎng)絡(luò),
14、所述第一層雙向gru網(wǎng)絡(luò)輸出為淺層特征信息的所述主觀性文本的全局上下文特征,所述第一層雙向gru網(wǎng)絡(luò)的輸出為所述第二層雙向gru網(wǎng)絡(luò)的輸入;
15、所述第二層雙向gru網(wǎng)絡(luò)輸出為深層特征信息的所述主觀性文本的全局上下文特征。
16、可選地,所述基于所述詞向量矩陣和寬動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)dcnn,得到所述主觀性文本的深度局部特征和邊緣信息,包括:
17、通過具有預(yù)定大小的寬卷積核的寬dcnn網(wǎng)絡(luò),在所述詞向量矩陣中依次進(jìn)行卷積操作,其中所述寬卷積核的預(yù)定大小不完全覆蓋所述詞向量矩陣;
18、在所述寬卷積核覆蓋不到所述詞向量矩陣的區(qū)域進(jìn)行零填充;
19、基于卷積操作,從所述寬卷積核覆蓋覆蓋所述詞向量矩陣的區(qū)域,提取所述主觀性文本的深度局部特征;
20、基于卷積操作,從所述寬卷積核覆蓋覆蓋不到所述詞向量矩陣的區(qū)域,提取所述主觀性文本的邊緣信息。
21、可選地,所述寬dcnn網(wǎng)絡(luò)包括第一寬dcnn網(wǎng)絡(luò)和第二寬dcnn網(wǎng)絡(luò),
22、所述第一寬dcnn網(wǎng)絡(luò)包括依次連接的第一寬卷積層、第一動(dòng)態(tài)k-max池化層、第二寬卷積層和第二k-max池化層;
23、所述第二寬dcnn網(wǎng)絡(luò)包括依次連接的第三寬卷積層、第三動(dòng)態(tài)k-max池化層、第四寬卷積層和第四k-max池化層;
24、其中,第一動(dòng)態(tài)k-max池化層和第二動(dòng)態(tài)k-max池化層的k值,通過所述主觀性文本的長度與對(duì)應(yīng)寬dcnn網(wǎng)絡(luò)的層數(shù)動(dòng)態(tài)計(jì)算得到;所述第一k-max池化層和第二k-max池化層的k值為預(yù)設(shè)值。
25、可選地,所述第一寬dcnn網(wǎng)絡(luò)包括依次連接的第一寬卷積層、第一動(dòng)態(tài)k-max池化層、第二寬卷積層和第二k-max池化層;
26、所述第二寬dcnn網(wǎng)絡(luò)包括依次連接的第三寬卷積層、第三動(dòng)態(tài)k-max池化層、第四寬卷積層和第四k-max池化層;
27、其中,第一動(dòng)態(tài)k-max池化層和第二動(dòng)態(tài)k-max池化層的k值,通過所述主觀性文本的長度與對(duì)應(yīng)寬dcnn網(wǎng)絡(luò)的層數(shù)動(dòng)態(tài)計(jì)算得到;所述第一k-max池化層和第二k-max池化層的k值為預(yù)設(shè)值。
28、可選地,所述得到融合特征之后,還包括:
29、通過注意力層為各融合特征分配注意力權(quán)重;
30、基于分配的注意力權(quán)重,計(jì)算各融合特征對(duì)應(yīng)的加權(quán)和;
31、基于所述加權(quán)和,確定所述主觀性文本的最終特征。
32、可選地,所述基于所述融合特征和全連接層,確定所述主觀性文本的情感極性類型,包括:
33、將所述主觀性文本的最終特征輸入所述全連接層;
34、通過所述全連接層采用的softmax激活函數(shù),計(jì)算出所述主觀性文本的情感概率值;
35、基于所述主觀性文本的情感概率值,確定所述主觀性文本的情感極性類型為積極性情感還是消極性情感。
36、第二方面,提供了一種文本情感極性分類裝置,包括處理器和存儲(chǔ)器,所述存儲(chǔ)器存儲(chǔ)可在所述處理器上運(yùn)行的程序或指令,所述程序或指令被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)如第一方面所述的方法的步驟。
37、第三方面,提供了一種可讀存儲(chǔ)介質(zhì),該可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有程序或指令,所述程序或指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如第一方面所述的方法的步驟。
38、在本申請(qǐng)實(shí)施例中,通過獲取主觀性文本對(duì)應(yīng)的詞向量矩陣;基于所述詞向量矩陣和雙向循環(huán)門控單元gru網(wǎng)絡(luò),得到所述主觀性文本的全局上下文特征;基于所述詞向量矩陣和寬動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)dcnn,得到所述主觀性文本的深度局部特征和邊緣信息;通過將所述全局上下文特征、深度局部特征和邊緣信息進(jìn)行融合,得到融合特征;基于所述融合特征和全連接層,確定所述主觀性文本的情感極性類型,由此通過構(gòu)建寬dcnn網(wǎng)絡(luò)與雙向gru網(wǎng)絡(luò)的并行混合網(wǎng)絡(luò),避免了串行結(jié)構(gòu)網(wǎng)絡(luò)不能有效利用多種特征信息導(dǎo)致的特征損失問題,并有效利用不同神經(jīng)網(wǎng)絡(luò)抽取主觀性文本的深度局部特征、全局上下文特征、邊緣特征的多種特征信息,提高了主觀性文本特征信息的豐富程度,進(jìn)而提高文本情感極性分類結(jié)果的準(zhǔn)確性。
1.一種文本情感極性分類方法,其特征在于,包括:
2.如權(quán)利要求1所述的方法,其特征在于,所述基于所述詞向量矩陣和雙向循環(huán)門控單元gru網(wǎng)絡(luò),得到所述主觀性文本的全局上下文特征,包括:
3.如權(quán)利要求2所述的方法,其特征在于,所述雙向gru網(wǎng)絡(luò)包括第一層雙向gru網(wǎng)絡(luò)和第二層雙向gru網(wǎng)絡(luò),
4.如權(quán)利要求1所述的方法,其特征在于,所述基于所述詞向量矩陣和寬動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)dcnn,得到所述主觀性文本的深度局部特征和邊緣信息,包括:
5.如權(quán)利要求4所述的方法,其特征在于,所述寬dcnn網(wǎng)絡(luò)包括第一寬dcnn網(wǎng)絡(luò)和第二寬dcnn網(wǎng)絡(luò),
6.如權(quán)利要求5所述的方法,其特征在于,
7.如權(quán)利要求1至6中任一項(xiàng)所述的方法,其特征在于,所述得到融合特征之后,還包括:
8.如權(quán)利要求7所述的方法,其特征在于,所述基于所述融合特征和全連接層,確定所述主觀性文本的情感極性類型,包括:
9.一種文本情感極性分類裝置,其特征在于,包括:存儲(chǔ)器和與所述存儲(chǔ)器電連接的處理器,所述存儲(chǔ)器存儲(chǔ)有可在所述處理器運(yùn)行的程序或指令,所述程序或指令被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至8中任一項(xiàng)所述的方法的步驟。
10.一種可讀存儲(chǔ)介質(zhì),其特征在于,所述可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有程序或指令,所述程序或指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至8中任一項(xiàng)所述的方法的步驟。