本發(fā)明涉及工業(yè)安全,尤其涉及一種基于需求反饋的安全宣教培訓問答優(yōu)化方法及系統(tǒng)。
背景技術(shù):
1、隨著工業(yè)化進程的不斷推進,安全宣教培訓工作顯得尤為重要,傳統(tǒng)的安全宣教培訓主要采用課堂講授、案例分析等方式,存在培訓內(nèi)容單一、互動性不足、針對性不強等問題,難以充分調(diào)動員工的學習積極性,培訓效果有限;
2、目前,現(xiàn)有技術(shù)主要通過構(gòu)建安全生產(chǎn)知識庫,開發(fā)智能問答系統(tǒng),為員工提供個性化的安全知識服務(wù),但知識庫的知識組織形式單一,缺乏多維度、多粒度的語義關(guān)聯(lián),難以準確理解員工的復(fù)雜需求;
3、因此,亟需一種方案解決現(xiàn)有技術(shù)中存在的問題。
技術(shù)實現(xiàn)思路
1、本發(fā)明實施例提供一種基于需求反饋的安全宣教培訓問答優(yōu)化方法及系統(tǒng),至少能解決現(xiàn)有技術(shù)中存在的部分問題。
2、本發(fā)明實施例的第一方面,提供一種基于需求反饋的安全宣教培訓問答優(yōu)化方法,包括:
3、獲取安全宣教培訓問答語料庫和安全生產(chǎn)領(lǐng)域知識庫,基于預(yù)先構(gòu)建的知識蒸餾網(wǎng)絡(luò)將所述安全生產(chǎn)領(lǐng)域知識庫中的結(jié)構(gòu)化知識遷移至所述安全宣教培訓問答語料庫的語義編碼空間中,得到語義增強編碼器,基于所述語義增強編碼器,通過對比學習訓練預(yù)先設(shè)置的安全宣教培訓問答匹配模型,基于所述安全宣教培訓問答匹配模型計算所述安全宣教培訓問答語料庫中不同問題-答案對的語義相似度,基于所述語義相似度構(gòu)建語義關(guān)聯(lián)圖譜;
4、獲取用戶問答交互日志,基于所述用戶問答交互日志構(gòu)建異構(gòu)交互圖,根據(jù)元路徑和注意力機制,結(jié)合圖表示學習算法學習所述異構(gòu)交互圖中各節(jié)點的語義表示,生成節(jié)點嵌入并結(jié)合多任務(wù)學習算法確定不同粒度的用戶特征并生成多維度用戶畫像,通過因果推斷理論建立所述用戶特征和用戶問答行為的因果關(guān)系圖,通過反事實方法學習個性化問答策略函數(shù)并對當前問答策略進行效應(yīng)評估,根據(jù)效應(yīng)評估結(jié)果自適應(yīng)生成個性化問題推薦列表;
5、基于所述語義關(guān)聯(lián)圖譜和所述多維度用戶畫像,對于根據(jù)所述個性化問題推薦列表生成的目標問題,通過異質(zhì)圖神經(jīng)網(wǎng)絡(luò)聚合嵌入向量,動態(tài)生成個性化語義關(guān)聯(lián)子圖并進行快速檢索,得到候選答案集,對所述候選答案集中的每個答案進行多角度特征提取,生成綜合答案質(zhì)量評估指標并通過非支配排序遺傳算法進行求解,得到最優(yōu)答案組合并返回至用戶,獲取反饋數(shù)據(jù)并根據(jù)所述反饋數(shù)據(jù)更新所述安全生產(chǎn)領(lǐng)域知識庫。
6、在一種可選的實施方式中,
7、獲取安全宣教培訓問答語料庫和安全生產(chǎn)領(lǐng)域知識庫,基于預(yù)先構(gòu)建的知識蒸餾網(wǎng)絡(luò)將所述安全生產(chǎn)領(lǐng)域知識庫中的結(jié)構(gòu)化知識遷移至所述安全宣教培訓問答語料庫的語義編碼空間中,得到語義增強編碼器,基于所述語義增強編碼器,通過對比學習訓練預(yù)先設(shè)置的安全宣教培訓問答匹配模型,基于所述安全宣教培訓問答匹配模型計算所述安全宣教培訓問答語料庫中不同問題-答案對的語義相似度,基于所述語義相似度構(gòu)建語義關(guān)聯(lián)圖譜包括:
8、獲取安全宣教培訓問答語料庫和安全生產(chǎn)領(lǐng)域知識庫,將所述安全宣教培訓問答語料庫表示為問答對,將所述安全生產(chǎn)領(lǐng)域知識庫表示為三元組;
9、基于預(yù)先構(gòu)建的知識蒸餾網(wǎng)絡(luò)中的語料編碼器將所述問答對映射為語義向量,通過知識蒸餾模型中的知識編碼器將所述三元組映射為知識向量,通過所述知識蒸餾網(wǎng)絡(luò)中的判別器區(qū)分所述語義向量和所述知識向量,通過語料編碼器將所述語義向量重構(gòu)為問答對,基于所述語料編碼器對應(yīng)的語料重構(gòu)損失和重構(gòu)后產(chǎn)生的知識分布匹配損失訓練所述知識蒸餾網(wǎng)絡(luò),將訓練后的知識蒸餾網(wǎng)絡(luò)中的語料編碼器和知識編碼器進行級聯(lián),融合得到所述語義增強編碼器;
10、基于所述語義增強編碼器設(shè)置對比學習框架,通過構(gòu)建正例負例對比訓練預(yù)先設(shè)置的安全宣教培訓問答匹配模型,其中,所述正例由存在語義相關(guān)的問答對構(gòu)成,所述負例由不存在語義相關(guān)的問答對構(gòu)成,通過最小化正例對比損失和負例的對比損失對所述安全宣教培訓問答匹配模型中的超參數(shù)進行修正,得到訓練后的安全宣教培訓問答匹配模型;
11、基于所述安全宣教培訓問答匹配模型,計算所述安全宣教培訓問答語料庫中不同問題-答案對間的語義相似度,基于所述語義相似度,以所述問題-答案對為節(jié)點構(gòu)建初始語義關(guān)聯(lián)圖譜,其中,所述初始語義關(guān)聯(lián)圖譜中節(jié)點間邊的權(quán)重為所述語義相似度,對構(gòu)建完成的所述初始語義關(guān)聯(lián)圖譜進行節(jié)點重要性采樣和邊權(quán)重剪枝,得到所述語義關(guān)聯(lián)圖譜。
12、在一種可選的實施方式中,
13、對構(gòu)建完成的所述初始語義關(guān)聯(lián)圖譜進行節(jié)點重要性采樣的概率如下公式所示:
14、;
15、其中, p i表示節(jié)點 v i的采樣概率, η表示平衡因子, i i表示節(jié)點 v i的基礎(chǔ)重要性, α表示衰減因子 ,k為最大跳數(shù),表示考慮的鄰域范圍,表示節(jié)點 v i的第 k跳鄰域, i j表示節(jié)點 vj的基礎(chǔ)重要性,表示節(jié)點 v j的第 k跳鄰域, c i表示節(jié)點 v i的緊密性中心, c j表示節(jié)點 v j的緊密性中心, v表示初始語義關(guān)聯(lián)圖譜中的全部節(jié)點的集合,其中,節(jié)點 v i、節(jié)點 v j和節(jié)點 v l都位于節(jié)點集合 v中, i l表示節(jié)點 v l的基礎(chǔ)重要性, l表示節(jié)點 v l的索引。
16、在一種可選的實施方式中,
17、獲取用戶問答交互日志,基于所述用戶問答交互日志構(gòu)建異構(gòu)交互圖,根據(jù)元路徑和注意力機制,結(jié)合圖表示學習算法學習所述異構(gòu)交互圖中各節(jié)點的語義表示,生成節(jié)點嵌入并結(jié)合多任務(wù)學習算法確定不同粒度的用戶特征并生成多維度用戶畫像,通過因果推斷理論建立所述用戶特征和用戶問答行為的因果關(guān)系圖,通過反事實方法學習個性化問答策略函數(shù)并對當前問答策略進行效應(yīng)評估,根據(jù)效應(yīng)評估結(jié)果自適應(yīng)生成個性化問題推薦列表包括:
18、獲取用戶在問答平臺上的歷史用戶問答交互日志,基于所述歷史用戶問答交互日志構(gòu)建異構(gòu)交互圖,其中,所述異構(gòu)交互圖包括多種不同的節(jié)點和邊,邊表示節(jié)點之間的交互關(guān)系;
19、在所述異構(gòu)交互圖中設(shè)置多條語義相關(guān)的元路徑,遍歷所述元路徑,對于每一條元路徑,確定每條元路徑下的所有子圖,基于所述子圖,將所述元路徑中每個節(jié)點對應(yīng)的直接相連的節(jié)點特征進行聚合,生成元路徑特征表示,在不同的元路徑上,通過注意力機制為不同節(jié)點對應(yīng)的元路徑表示分配權(quán)重并將不同元路徑的節(jié)點表示根據(jù)分配的權(quán)重進行加權(quán)求和,得到綜合語義表示,基于所述綜合語義表示,對于每個節(jié)點生成對應(yīng)的節(jié)點嵌入;
20、基于所述節(jié)點嵌入,通過多任務(wù)學習算法,以用戶節(jié)點的嵌入作為當前用戶的初始特征表示,結(jié)合用戶屬性特征和行為統(tǒng)計特征構(gòu)建當前用戶對應(yīng)的綜合用戶特征,基于所述綜合用戶特征設(shè)計多個用戶理解任務(wù),基于所述用戶理解任務(wù)對應(yīng)的任務(wù)損失函數(shù),構(gòu)建多個維度的用戶特征表示,綜合得到所述多維度用戶畫像;
21、基于所述多維度用戶畫像,通過因果推斷算法建立所述用戶特征表示與用戶問答行為之間的因果關(guān)系,將所述用戶特征表示作為動作,所述用戶問答行為作為結(jié)果,通過因果圖評估不同用戶特征下的問答行為差異,基于所述問答行為差異構(gòu)建所述因果關(guān)系圖;
22、基于所述因果關(guān)系圖,通過反事實方法,構(gòu)建以用戶特征為輸入,問答策略為輸出的個性化問答策略函數(shù),基于所述個性化問答策略函數(shù),通過反事實推斷算法對不同問答策略的因果效應(yīng)進行效應(yīng)評估,基于效應(yīng)評估結(jié)果確定最優(yōu)因果效應(yīng)對應(yīng)的最優(yōu)問答策略,基于所述最優(yōu)問答策略生成所述個性化問題推薦列表。
23、在一種可選的實施方式中,
24、通過反事實推斷算法對不同問答策略的因果效應(yīng)進行效應(yīng)評估如下公式所示:
25、;
26、其中, ate表示效應(yīng)評估結(jié)果, n表示樣本數(shù)量, y m表示用戶 m的實際觀測結(jié)果, t m表示用戶 m的處理狀態(tài), e( x m)為用戶 m的傾向性得分,表示在給定協(xié)變量 x m條件下用戶接受處理的概率, h( t=1)表示樣本中實際接受處理的概率, h( t=0)表示樣本中實際未接受處理的概率,表示在協(xié)變量 x m條件下用戶接受處理的概率,表示在協(xié)變量 x m條件下用戶不接受處理的概率。
27、在一種可選的實施方式中,
28、基于所述語義關(guān)聯(lián)圖譜和所述多維度用戶畫像,對于根據(jù)所述個性化問題推薦列表生成的目標問題,通過異質(zhì)圖神經(jīng)網(wǎng)絡(luò)聚合嵌入向量,動態(tài)生成個性化語義關(guān)聯(lián)子圖并進行快速檢索,得到候選答案集,對所述候選答案集中的每個答案進行多角度特征提取,生成綜合答案質(zhì)量評估指標并通過非支配排序遺傳算法進行求解,得到最優(yōu)答案組合并返回至用戶,獲取反饋數(shù)據(jù)并根據(jù)所述反饋數(shù)據(jù)更新所述安全生產(chǎn)領(lǐng)域知識庫包括:
29、初始化異質(zhì)圖神經(jīng)網(wǎng)絡(luò),將所述語義關(guān)聯(lián)圖譜轉(zhuǎn)化為異質(zhì)圖數(shù)據(jù)結(jié)構(gòu)并定義節(jié)點,通過基于元路徑的隨機游走算法在所述異質(zhì)圖數(shù)據(jù)結(jié)構(gòu)上采集生成訓練數(shù)據(jù),通過所述訓練數(shù)據(jù)對所述異質(zhì)圖神經(jīng)網(wǎng)絡(luò)進行訓練,將所述多維度用戶畫像嵌入至所述異質(zhì)圖神經(jīng)網(wǎng)絡(luò)中,通過附加的用戶表示學習層將所述用戶特征映射至圖譜語義空間,確定語義編碼函數(shù),得到優(yōu)化后的異質(zhì)圖神經(jīng)網(wǎng)絡(luò);
30、對于所述個性化問題推薦列表中的每個目標問題,通過優(yōu)化后的異質(zhì)圖神經(jīng)網(wǎng)絡(luò)根據(jù)每個問題對應(yīng)的節(jié)點,確定鄰居節(jié)點以及所述鄰居節(jié)點與所述多維度用戶畫像的語義相似性,生成所述個性化語義關(guān)聯(lián)子圖;
31、在所述個性化語義關(guān)聯(lián)子圖上,以所述目標問題為中心,通過基于圖的快速近似最近鄰搜索算法檢索與問題語義相關(guān)的候選答案節(jié)點,生成所述候選答案集,對于所述候選答案集中的每個答案,通過特征提取算法分別提取語義相關(guān)性、結(jié)構(gòu)相關(guān)性、用戶相關(guān)性和知識質(zhì)量,組合得到多角度特征,基于所述多角度特征確定綜合答案質(zhì)量評估指標,通過歸一化操作和加權(quán)組合所述多角度特征,生成綜合答案質(zhì)量評估向量;
32、將每個候選答案對應(yīng)的綜合答案質(zhì)量評估向量作為多目標優(yōu)化算法的目標函數(shù)值,以答案組合為優(yōu)化變量,構(gòu)建答案組合的搜索空間,隨機生成初始種群,所述初始種群中的每個個體表示一個答案組合,所述綜合答案質(zhì)量評估向量為當前個體的適應(yīng)度值;
33、對所述初始種群進行非支配排序,根據(jù)每個個體的支配關(guān)系將所述個體劃分至不同的前沿面,計算每個個體的擁擠度,基于預(yù)先設(shè)置的擁擠度閾值對所述個體進行篩選,若所述擁擠度大于所述擁擠度閾值,則去除當前個體,否則保留當前個體,對保留的個體進行交叉操作和變異操作,生成子代個體,將所述子代個體與被保留的個體進行合并,得到候選二代個體,對所述二代個體進行非支配排序和擁擠度計算,基于所述擁擠度再次進行篩選,將被保留的個體組合得到二代個體,重復(fù)迭代直至達到預(yù)設(shè)的最大迭代次數(shù),選擇具有最優(yōu)的綜合答案質(zhì)量評估向量的答案組合作為最優(yōu)答案組合返回至用戶,收集用戶對于所述最優(yōu)答案組合的顯式反饋數(shù)據(jù)和隱式反饋數(shù)據(jù)對所述安全生產(chǎn)領(lǐng)域知識庫進行更新。
34、在一種可選的實施方式中,
35、對所述初始種群進行非支配排序如下公式所示:
36、;
37、其中, f( s)表示非支配排序向量, θ表示相似度閾值,f( s)表示答案組合 s的質(zhì)量向量, nu表示個體總數(shù), sin( c a, c j)表示個體 c a和個體 c j之間的相似度,∪ a∈ s表示對答案組合 s中的每一個元素 a進行并集操作, β表示約束違規(guī)度權(quán)重, g( s)表示答案組合 s的約束違規(guī)度。
38、本發(fā)明實施例的第二方面,提供一種基于需求反饋的安全宣教培訓問答優(yōu)化系統(tǒng),包括:
39、第一單元,用于獲取安全宣教培訓問答語料庫和安全生產(chǎn)領(lǐng)域知識庫,基于預(yù)先構(gòu)建的知識蒸餾網(wǎng)絡(luò)將所述安全生產(chǎn)領(lǐng)域知識庫中的結(jié)構(gòu)化知識遷移至所述安全宣教培訓問答語料庫的語義編碼空間中,得到語義增強編碼器,基于所述語義增強編碼器,通過對比學習訓練預(yù)先設(shè)置的安全宣教培訓問答匹配模型,基于所述安全宣教培訓問答匹配模型計算所述安全宣教培訓問答語料庫中不同問題-答案對的語義相似度,基于所述語義相似度構(gòu)建語義關(guān)聯(lián)圖譜;
40、第二單元,用于獲取用戶問答交互日志,基于所述用戶問答交互日志構(gòu)建異構(gòu)交互圖,根據(jù)元路徑和注意力機制,結(jié)合圖表示學習算法學習所述異構(gòu)交互圖中各節(jié)點的語義表示,生成節(jié)點嵌入并結(jié)合多任務(wù)學習算法確定不同粒度的用戶特征并生成多維度用戶畫像,通過因果推斷理論建立所述用戶特征和用戶問答行為的因果關(guān)系圖,通過反事實方法學習個性化問答策略函數(shù)并對當前問答策略進行效應(yīng)評估,根據(jù)效應(yīng)評估結(jié)果自適應(yīng)生成個性化問題推薦列表;
41、第三單元,用于基于所述語義關(guān)聯(lián)圖譜和所述多維度用戶畫像,對于根據(jù)所述個性化問題推薦列表生成的目標問題,通過異質(zhì)圖神經(jīng)網(wǎng)絡(luò)聚合嵌入向量,動態(tài)生成個性化語義關(guān)聯(lián)子圖并進行快速檢索,得到候選答案集,對所述候選答案集中的每個答案進行多角度特征提取,生成綜合答案質(zhì)量評估指標并通過非支配排序遺傳算法進行求解,得到最優(yōu)答案組合并返回至用戶,獲取反饋數(shù)據(jù)并根據(jù)所述反饋數(shù)據(jù)更新所述安全生產(chǎn)領(lǐng)域知識庫。
42、本發(fā)明實施例的第三方面,
43、提供一種電子設(shè)備,包括:
44、處理器;
45、用于存儲處理器可執(zhí)行指令的存儲器;
46、其中,所述處理器被配置為調(diào)用所述存儲器存儲的指令,以執(zhí)行前述所述的方法。
47、本發(fā)明實施例的第四方面,
48、提供一種計算機可讀存儲介質(zhì),其上存儲有計算機程序指令,所述計算機程序指令被處理器執(zhí)行時實現(xiàn)前述所述的方法。
49、本發(fā)明中,通過知識蒸餾網(wǎng)絡(luò)將結(jié)構(gòu)化知識庫中的知識遷移至問答語料庫的語義編碼空間,實現(xiàn)了知識的語義增強表示,為后續(xù)的問答匹配和語義關(guān)聯(lián)挖掘奠定了基礎(chǔ),通過語義相似度構(gòu)建語義關(guān)聯(lián)圖譜,刻畫了問題-答案間的復(fù)雜語義關(guān)聯(lián),為個性化問答提供了豐富的語義信息,利用因果推斷理論建立用戶特征與問答行為的因果關(guān)系,通過反事實學習個性化問答策略函數(shù),可以根據(jù)用戶畫像自適應(yīng)生成個性化問題推薦列表,實現(xiàn)了精準的需求理解與問題推薦,個性化語義關(guān)聯(lián)子圖聚焦于與用戶畫像高度相關(guān)的語義信息,提高了候選答案的針對性和個性化程度,持續(xù)的知識庫擴充與優(yōu)化有助于提升系統(tǒng)的知識覆蓋面和問答質(zhì)量,同時根據(jù)用戶反饋動態(tài)調(diào)整問答策略,使系統(tǒng)能夠適應(yīng)用戶需求的變化,綜上,本實施例顯著提升了安全宣教培訓問答的智能化和個性化水平,為員工提供更加精準、高質(zhì)量和滿足個性化需求的安全知識服務(wù),對于提高企業(yè)安全宣教培訓效果、促進員工安全意識和技能提升、保障企業(yè)安全生產(chǎn)具有重要意義。