本公開(kāi)涉及計(jì)算機(jī)領(lǐng)域,尤其涉及語(yǔ)義要素識(shí)別方法、裝置、電子設(shè)備和計(jì)算機(jī)程序產(chǎn)品。
背景技術(shù):
1、近年來(lái),深度學(xué)習(xí)模型在自然語(yǔ)言理解任務(wù)上取得了顯著的成果。用戶(hù)常常通過(guò)訓(xùn)練后的深度學(xué)習(xí)模型對(duì)目標(biāo)文本內(nèi)容進(jìn)行語(yǔ)義要素識(shí)別。
2、相關(guān)技術(shù)中,深度學(xué)習(xí)模型的訓(xùn)練過(guò)程通常包括灌注大量的語(yǔ)言訓(xùn)練數(shù)據(jù),結(jié)合監(jiān)督、無(wú)監(jiān)督或半監(jiān)督訓(xùn)練方法,使模型能夠?qū)W習(xí)文本中的語(yǔ)義要素,從而完成模型的訓(xùn)練。然而,由于模型的訓(xùn)練樣本數(shù)據(jù)和參數(shù)數(shù)量較多,導(dǎo)致模型的訓(xùn)練過(guò)程需要耗費(fèi)大量的計(jì)算資源和時(shí)間成本。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本公開(kāi)示例性實(shí)施例提供了一種語(yǔ)義要素識(shí)別方法、裝置、電子設(shè)備和計(jì)算機(jī)程序產(chǎn)品,以解決相關(guān)技術(shù)中存在的問(wèn)題。
2、本公開(kāi)示例性實(shí)施例的第一方面,提供了一種語(yǔ)義要素識(shí)別方法,該方法包括:
3、接收用戶(hù)發(fā)送的待處理文本;
4、獲取預(yù)先構(gòu)建的語(yǔ)義要素識(shí)別模型,并將所述待處理文本輸入所述語(yǔ)義要素識(shí)別模型,獲得所述待處理文本對(duì)應(yīng)的語(yǔ)義要素預(yù)測(cè)結(jié)果;所述語(yǔ)義要素識(shí)別模型的網(wǎng)絡(luò)結(jié)構(gòu)包括詞嵌入層、信息提取層和輸出層;其中,所述詞嵌入層用于獲取所述待處理文本對(duì)應(yīng)的多個(gè)標(biāo)識(shí)信息,并分別將所述多個(gè)標(biāo)識(shí)信息轉(zhuǎn)換為對(duì)應(yīng)的詞向量矩陣;所述信息提取層用于提取多個(gè)詞向量矩陣分別對(duì)應(yīng)的文本特征向量;所述輸出層用于將多個(gè)文本特征向量轉(zhuǎn)換為對(duì)應(yīng)的語(yǔ)義要素預(yù)測(cè)結(jié)果。
5、本公開(kāi)示例性實(shí)施例的第二方面,提供了一種語(yǔ)義要素識(shí)別裝置,該裝置包括:
6、數(shù)據(jù)獲取模塊,用于接收用戶(hù)發(fā)送的待處理文本;
7、數(shù)據(jù)處理模塊,用于獲取預(yù)先構(gòu)建的語(yǔ)義要素識(shí)別模型,并將所述待處理文本輸入所述語(yǔ)義要素識(shí)別模型,獲得所述待處理文本對(duì)應(yīng)的語(yǔ)義要素預(yù)測(cè)結(jié)果;所述語(yǔ)義要素識(shí)別模型的網(wǎng)絡(luò)結(jié)構(gòu)包括詞嵌入層、信息提取層和輸出層;其中,所述詞嵌入層用于獲取所述待處理文本對(duì)應(yīng)的多個(gè)標(biāo)識(shí)信息,并分別將所述多個(gè)標(biāo)識(shí)信息轉(zhuǎn)換為對(duì)應(yīng)的詞向量矩陣;所述信息提取層用于提取多個(gè)詞向量矩陣分別對(duì)應(yīng)的文本特征向量;所述輸出層用于將多個(gè)文本特征向量轉(zhuǎn)換為對(duì)應(yīng)的語(yǔ)義要素預(yù)測(cè)結(jié)果。
8、本公開(kāi)示例性實(shí)施例的第三方面,提供了一種電子設(shè)備,包括:
9、至少一個(gè)處理器;
10、用于存儲(chǔ)至少一個(gè)處理器可執(zhí)行指令的存儲(chǔ)器;其中,至少一個(gè)處理器用于執(zhí)行指令,以實(shí)現(xiàn)上述方法的步驟。
11、根據(jù)本公開(kāi)的第四方面,提供了一種計(jì)算機(jī)程序產(chǎn)品,所述計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)本公開(kāi)示例性實(shí)施例所述的方法。
12、本公開(kāi)示例性實(shí)施例采用的上述至少一個(gè)技術(shù)方案能夠達(dá)到以下有益效果:通過(guò)訓(xùn)練文本對(duì)預(yù)設(shè)模型進(jìn)行訓(xùn)練可以使模型在特定領(lǐng)域的任務(wù)上學(xué)習(xí)到對(duì)應(yīng)的語(yǔ)義要素,并減少訓(xùn)練過(guò)程中所需的計(jì)算資源。其次,語(yǔ)義要素識(shí)別模型利用預(yù)訓(xùn)練的詞嵌入層和信息提取層,將特征提取工作分解到不同層次,從而減輕模型的訓(xùn)練成本,使得深度學(xué)習(xí)模型能夠集成在中小型系統(tǒng)中,推動(dòng)了深度學(xué)習(xí)模型在語(yǔ)義理解任務(wù)中的廣泛應(yīng)用。
1.一種語(yǔ)義要素識(shí)別方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述信息提取層包括多個(gè)信息提取子模塊;所述信息提取層用于提取多個(gè)詞向量矩陣分別對(duì)應(yīng)的文本特征向量,包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述信息提取子模塊包括卷積網(wǎng)絡(luò)、上采樣層或池化層,所述卷積網(wǎng)絡(luò)、上采樣層或池化層按預(yù)設(shè)順序排列,所述方法還包括:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述方法還包括:
6.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述基于多次訓(xùn)練分別對(duì)應(yīng)的歐式距離,確定后續(xù)訓(xùn)練所使用的訓(xùn)練樣本或所述預(yù)設(shè)模型的權(quán)重,包括:
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述方法還包括:
8.一種語(yǔ)義要素識(shí)別裝置,其特征在于,所述裝置包括:
9.一種電子設(shè)備,其特征在于,包括:
10.一種計(jì)算機(jī)程序產(chǎn)品,其特征在于,所述計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1-7中任一項(xiàng)所述的方法。