本發(fā)明涉及負(fù)荷監(jiān)測(cè),特別涉及一種基于時(shí)序功率數(shù)據(jù)增強(qiáng)和對(duì)比學(xué)習(xí)的少標(biāo)簽nilm方法。
背景技術(shù):
1、日益嚴(yán)峻的能源危機(jī)和全球變暖對(duì)人類的生存和可持續(xù)發(fā)展造成了嚴(yán)重的威脅,“碳達(dá)峰、碳中和”成為了國(guó)際社會(huì)共同關(guān)注的問題。通過負(fù)荷監(jiān)測(cè)向用戶提供實(shí)時(shí)的家庭用電信息,可以幫助用戶改善用電習(xí)慣,減少5-20%的能源浪費(fèi),對(duì)“雙碳”目標(biāo)的實(shí)現(xiàn)有著重要意義。
2、現(xiàn)有的非侵入式負(fù)荷監(jiān)測(cè)方法嚴(yán)重依賴大量的帶標(biāo)簽數(shù)據(jù),標(biāo)簽的高成本和隱私性限制了nilm方法的可實(shí)現(xiàn)性和通用性,且其對(duì)多狀態(tài)設(shè)備和特征相似設(shè)備的識(shí)別效果有限。針對(duì)實(shí)際缺少帶標(biāo)簽數(shù)據(jù)的nilm應(yīng)用場(chǎng)景,目前還沒有一種僅針對(duì)原始時(shí)序功率數(shù)據(jù)進(jìn)行對(duì)比式自監(jiān)督學(xué)習(xí)的nilm方法,通過挖掘大量無(wú)標(biāo)簽時(shí)序功率數(shù)據(jù)的深層通用特征,提高對(duì)多狀態(tài)設(shè)備和特征相似設(shè)備的識(shí)別效果,同時(shí)實(shí)現(xiàn)不同家庭同一負(fù)荷不同參數(shù)之間的特性轉(zhuǎn)移。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的是為了提供一種基于時(shí)序功率數(shù)據(jù)增強(qiáng)和對(duì)比學(xué)習(xí)的少標(biāo)簽nilm方法,通過此方法,能夠降低對(duì)標(biāo)簽數(shù)據(jù)的依賴,降低nilm成本,實(shí)現(xiàn)不同家庭同類設(shè)備的跨域特性轉(zhuǎn)移,提高nilm的通用性,并提高了對(duì)多狀態(tài)設(shè)備和特征相似設(shè)備的識(shí)別效果。
2、為了解決上述技術(shù)問題,本發(fā)明提出如下技術(shù)方案:
3、圖1為本發(fā)明的流程圖,如圖1所示:
4、一種基于時(shí)序功率數(shù)據(jù)增強(qiáng)和對(duì)比學(xué)習(xí)的少標(biāo)簽nilm方法,包括以下步驟:
5、步驟1:對(duì)原始功率數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理;
6、步驟2:利用一個(gè)固定長(zhǎng)度的滑動(dòng)窗口對(duì)一維歸一化后數(shù)據(jù)進(jìn)行事件檢測(cè),獲得設(shè)備運(yùn)行時(shí)的無(wú)標(biāo)簽功率時(shí)序片段,構(gòu)建無(wú)標(biāo)簽數(shù)據(jù)集;
7、步驟3:利用對(duì)比學(xué)習(xí)框架,構(gòu)建一個(gè)時(shí)序功率增強(qiáng)的nilm模型,包括時(shí)序數(shù)據(jù)增強(qiáng)、正負(fù)樣本、編碼器、投影頭、對(duì)比損失、偽標(biāo)簽和隊(duì)列七個(gè)部分;
8、步驟4:將步驟2獲得的無(wú)標(biāo)簽功率時(shí)序片段輸入到時(shí)序功率增強(qiáng)的nilm模型中,完成預(yù)訓(xùn)練,獲得能夠挖掘時(shí)序功率數(shù)據(jù)深層特征的se編碼器;
9、步驟5:完成模型的微調(diào);
10、步驟6:進(jìn)行非侵入式負(fù)荷識(shí)別測(cè)試。
11、所述方法通過對(duì)大量無(wú)標(biāo)簽數(shù)據(jù)進(jìn)行對(duì)比式自監(jiān)督學(xué)習(xí),利用基于時(shí)間卷積網(wǎng)絡(luò)的編碼器充分挖掘時(shí)序功率數(shù)據(jù)的深層特征信息,將預(yù)訓(xùn)練獲得的公用主編碼器遷移到特定的下游負(fù)荷識(shí)別任務(wù)中,使用少量的帶標(biāo)簽數(shù)據(jù)微調(diào)分類器,實(shí)現(xiàn)在少標(biāo)簽場(chǎng)景下的負(fù)荷識(shí)別,并實(shí)現(xiàn)不同家庭同一類型不同參數(shù)設(shè)備之間的跨域性能轉(zhuǎn)移。
12、在步驟1中:對(duì)原始功率數(shù)據(jù)依次進(jìn)行以下數(shù)據(jù)預(yù)處理:
13、1)重采樣:將數(shù)據(jù)時(shí)間戳的間隔重采樣為3s;
14、2)刪除缺省值:刪除因發(fā)生故障丟失的數(shù)據(jù),保證數(shù)據(jù)的有效性;
15、3)篩選并剔除異常值
16、4)歸一化:對(duì)數(shù)據(jù)進(jìn)行歸一化,歸一化公式為:
17、
18、其中,xt為t時(shí)刻的數(shù)據(jù),為設(shè)備的平均值,σ為設(shè)備的標(biāo)準(zhǔn)差。
19、在步驟2中:滑動(dòng)窗口的固定長(zhǎng)度為n,從歸一化后數(shù)據(jù)時(shí)刻0開始滑動(dòng),步長(zhǎng)為s,假設(shè)此窗口中連續(xù)有m個(gè)數(shù)據(jù)大于閾值δ,則認(rèn)定事件發(fā)生,將此數(shù)據(jù)片段保存到預(yù)訓(xùn)練數(shù)據(jù)集中。
20、在步驟3中:構(gòu)建一個(gè)時(shí)序功率增強(qiáng)的nilm模型,包括時(shí)序數(shù)據(jù)增強(qiáng)、正負(fù)樣本、編碼器、投影頭、對(duì)比損失、偽標(biāo)簽和隊(duì)列七個(gè)部分,七個(gè)部分分別如下:
21、1)時(shí)序數(shù)據(jù)增強(qiáng):采用隨機(jī)縮放、隨機(jī)偏移和隨機(jī)抖動(dòng)這三種組合對(duì)時(shí)序功率數(shù)據(jù)進(jìn)行數(shù)據(jù)增強(qiáng),使編碼器學(xué)習(xí)其不變的特征表示,增加模型的泛化能力和魯棒性,其中每個(gè)數(shù)據(jù)增強(qiáng)的概率為0.5,增強(qiáng)因子為0.1;對(duì)單個(gè)輸入的時(shí)序功率數(shù)據(jù)
22、縮放:按照隨機(jī)產(chǎn)生的縮放因子,隨機(jī)縮放原始功率序列的整體幅值;
23、偏移:在原始功率序列上添加隨機(jī)偏移,通過隨機(jī)標(biāo)量值進(jìn)行位移;
24、抖動(dòng):對(duì)輸入數(shù)據(jù)進(jìn)行隨機(jī)擾動(dòng),為原始的功率序列每個(gè)時(shí)間步長(zhǎng)添加一個(gè)隨機(jī)高斯噪聲;
25、2)正負(fù)樣本:在一批數(shù)據(jù)中,包含此樣本query?q和它對(duì)應(yīng)的正樣本k+,q和k+來自同一個(gè)數(shù)據(jù)的不同數(shù)據(jù)增強(qiáng),這一批其他的數(shù)據(jù)作為負(fù)樣本k-,其經(jīng)過動(dòng)量編碼和mlp投影后更新隊(duì)列,保證隊(duì)列中負(fù)樣本(key)的一致性;
26、3)編碼器:在對(duì)比學(xué)習(xí)預(yù)訓(xùn)練模型中,包括兩個(gè)結(jié)構(gòu)相同,參數(shù)不同的編碼器(se編碼器和動(dòng)量編碼器);構(gòu)建了基于時(shí)間卷積網(wǎng)絡(luò)的編碼器fq,由n個(gè)殘差塊(tcnblock),dropout層和一維卷積模塊組成,對(duì)輸入數(shù)據(jù)進(jìn)行編碼;
27、4)投影頭:投影頭由單層mlp構(gòu)成,將編碼后的表示映射到應(yīng)用對(duì)比損失的潛在空間;
28、5)對(duì)比損失:使用噪聲對(duì)比估計(jì)(nce)的一個(gè)變體infonce作為損失函數(shù),計(jì)算損失并更新模型參數(shù),不斷縮小正樣本之間的距離:
29、
30、其中,k+為q的正樣本,k-為隊(duì)列k中q的所有負(fù)樣本,τ為溫度超參數(shù);
31、6)偽標(biāo)簽:模型根據(jù)在數(shù)據(jù)中找到的屬性自動(dòng)生成偽標(biāo)簽,以此偽標(biāo)簽作為監(jiān)督信息進(jìn)行對(duì)比學(xué)習(xí),不斷縮小正樣本之間的距離,最大化同一實(shí)例不同增強(qiáng)版本之間的相似性;
32、7)隊(duì)列:通過不斷地進(jìn)棧和出棧更新隊(duì)列,為對(duì)比學(xué)習(xí)提供大量的不斷更新的負(fù)樣本。
33、在步驟4中,將步驟2獲得的無(wú)標(biāo)簽數(shù)據(jù)輸入到時(shí)序功率增強(qiáng)的nilm模型中,完成預(yù)訓(xùn)練,獲得能夠挖掘時(shí)序功率數(shù)據(jù)深層特征的se編碼器;首先編碼器對(duì)增強(qiáng)后的數(shù)據(jù)進(jìn)行編碼,其次投影頭將此編碼映射到應(yīng)用對(duì)比損失的潛在空間,然后計(jì)算損失,通過反向傳播更新se編碼器參數(shù)。
34、所述數(shù)據(jù)增強(qiáng)為:
35、對(duì)于一個(gè)時(shí)序數(shù)據(jù)x,其分別經(jīng)過兩次的不同的數(shù)據(jù)增強(qiáng)后,輸出為xq和xk,分別作為輸入連接到se編碼器encoder_q和動(dòng)量編碼器encoder_k;
36、所述編碼器具體為:
37、對(duì)于一個(gè)時(shí)序數(shù)據(jù)作為編碼器的輸入,連接到tcnblock?1的輸入,tcnblock?1的輸出連接到tcnblock?2的輸入,以此類推,tcnblock?n-1的輸出連接到tcnblock?n的輸入;
38、tcnblock?n的輸出作為dropout操作的輸入,dropout操作的輸出作為一維卷積模塊conv1d的輸入,經(jīng)過一維卷積模塊得到最終輸出。
39、每個(gè)tcnblock由dilated?causal?conv(膨脹因果卷積)和gelu激活函數(shù)組成,tcnblock的輸入作為gelu激活函數(shù)的輸入,gelu激活函數(shù)的輸出連接到dilated?causalconv的輸入,dilated?causal?conv的輸出連接到gelu激活函數(shù)的輸入,tcnblock的輸入作為1×1conv的輸入,1×1conv的輸出作為殘差與dilated?causal?conv的輸出相加連接后作為tcnblock的輸出。
40、所述投影頭具體為:編碼器的輸出分別連接到投影頭hq和投影頭hk的輸入,投影頭由一個(gè)單層的mlp構(gòu)成,由mlp操作后得到投影頭hq和投影頭hk的輸出;
41、所述隊(duì)列具體為:
42、投影頭hk的輸出連接到隊(duì)列的輸入,隊(duì)列由一個(gè)動(dòng)態(tài)字典構(gòu)成,投影頭hk的輸出不斷對(duì)隊(duì)列進(jìn)行進(jìn)棧和出棧更新隊(duì)列;
43、所述對(duì)比損失具體為:
44、隊(duì)列中包含的若干投影頭hk的輸出和投影頭hq的輸出計(jì)算對(duì)比損失;
45、計(jì)算對(duì)比損失后通過優(yōu)化器的梯度更新和反向傳播,更新se編碼器和投影頭hq的參數(shù),動(dòng)量編碼器和投影頭hk的參數(shù)根據(jù)se編碼器和投影頭hq的參數(shù)進(jìn)行動(dòng)態(tài)更新。
46、在步驟5中,根據(jù)特定的下游負(fù)荷識(shí)別任務(wù),遷移并固定se編碼器的參數(shù),在編碼器后加一個(gè)由一個(gè)全連接層構(gòu)成的分類器,從預(yù)訓(xùn)練數(shù)據(jù)集中提取少部分?jǐn)?shù)據(jù)并為其打上標(biāo)簽,利用此少部分帶標(biāo)簽數(shù)據(jù)微調(diào)此分類器,為se編碼器挖掘的設(shè)備特性表示映射對(duì)應(yīng)的設(shè)備類別標(biāo)簽。
47、本發(fā)明具有的技術(shù)效果為:
48、1)本發(fā)明提出了一種基于時(shí)序功率數(shù)據(jù)增強(qiáng)和對(duì)比學(xué)習(xí)的少標(biāo)簽nilm方法,可以在少標(biāo)簽場(chǎng)景下實(shí)現(xiàn)高準(zhǔn)確率識(shí)別,提高nilm的有效性和實(shí)用性。考慮帶標(biāo)簽數(shù)據(jù)的高成本和隱私性問題,本發(fā)明利用對(duì)比學(xué)習(xí)架構(gòu)構(gòu)建預(yù)訓(xùn)練模型,可以從無(wú)標(biāo)簽時(shí)序功率數(shù)據(jù)中學(xué)習(xí)設(shè)備特征,預(yù)訓(xùn)練時(shí)的時(shí)序功率數(shù)據(jù)增強(qiáng)方式增強(qiáng)了模型學(xué)習(xí)特征的能力,在微調(diào)時(shí)利用少部分帶標(biāo)簽數(shù)據(jù)微調(diào)分類器后,即可在少標(biāo)簽場(chǎng)景下實(shí)現(xiàn)高準(zhǔn)確率識(shí)別;
49、2)本發(fā)明構(gòu)建了一個(gè)基于時(shí)間卷積網(wǎng)絡(luò)的編碼器,可以有效挖掘時(shí)序功率數(shù)據(jù)的深層特征,從而提高對(duì)多狀態(tài)設(shè)備和特征相似設(shè)備的識(shí)別準(zhǔn)確率??紤]到多狀態(tài)設(shè)備各狀態(tài)之間的時(shí)序特征,以及特征相似設(shè)備中時(shí)序特征的不同,編碼器利用dilated?causalconv、殘差跨層連接和conv1d模塊,使用不同尺度的卷積核提取功率序列中不同尺度上的時(shí)序特征,挖掘數(shù)據(jù)本身的結(jié)構(gòu)及關(guān)聯(lián)信息,使編碼器可學(xué)習(xí)時(shí)序功率數(shù)據(jù)的深層特征,并獲取時(shí)序數(shù)據(jù)更長(zhǎng)時(shí)間的依賴關(guān)系。