視頻鑒別方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供一種視頻鑒別方法,包括:對已知類型的多幅圖像進行預處理,所述預處理至少包括數(shù)據(jù)增廣;將預處理后的多幅圖像輸入到卷積神經(jīng)網(wǎng)絡中利用鑒別模型進行類型鑒別訓練,根據(jù)類型鑒別結(jié)果和所述已知類型優(yōu)化所述鑒別模型;獲取待鑒別圖像;利用所述卷積神經(jīng)網(wǎng)絡中的優(yōu)化后的鑒別模型對所述多幅待鑒別圖像進行鑒別。本發(fā)明還提供一種視頻鑒別系統(tǒng)。本發(fā)明通過增廣的鑒別訓練,增強了卷積神經(jīng)網(wǎng)絡的模型的泛化能力;通過將視頻處理成圖像,利用卷積神經(jīng)網(wǎng)絡進行鑒別,提高了視頻鑒別的準確率和速度。
【專利說明】
視頻鑒別方法及系統(tǒng)
技術(shù)領(lǐng)域
[0001] 本發(fā)明實施例涉及信息安全技術(shù)領(lǐng)域,尤其涉及一種視頻鑒別方法及系統(tǒng)。
【背景技術(shù)】
[0002] 隨著計算機硬件及互聯(lián)網(wǎng)大數(shù)據(jù)的快速發(fā)展,互聯(lián)網(wǎng)中視頻數(shù)量呈現(xiàn)出爆炸式增 長的態(tài)勢。這其中存在著大量冗余、重復、侵犯知識產(chǎn)權(quán)、血腥、暴力、恐怖或淫穢等非法視 頻內(nèi)容。
[0003] 目前,人們可以利用計算機替代人類完成一些視覺識別任務。例如人們可以利用 計算機完成監(jiān)控系統(tǒng)的智能監(jiān)視,還可以利用計算機完成視頻內(nèi)容的識別與審核等。通常, 利用計算機替代人類完成視頻鑒別和審核需要創(chuàng)建復雜的計算模型,進行大批量數(shù)據(jù)的運 算。由于創(chuàng)建的計算模型不佳和運算誤差累積,這會導致計算機識別錯誤或者識別緩慢的 情況出現(xiàn),無法滿足人們對精確度和及時性的要求。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明實施例提供一種視頻鑒別方法及系統(tǒng),用以解決現(xiàn)有技術(shù)中識別準確度 低,容錯能力和泛化能力差等問題。
[0005] 本發(fā)明實施例提供一種視頻鑒別方法,該方法包括:
[0006] 對已知類型的多幅圖像進行預處理,所述預處理至少包括數(shù)據(jù)增廣;
[0007] 將預處理后的多幅圖像輸入到卷積神經(jīng)網(wǎng)絡中利用鑒別模型進行類型鑒別訓練, 根據(jù)類型鑒別結(jié)果和所述已知類型優(yōu)化所述鑒別模型;
[0008] 獲取多幅待鑒別圖像;
[0009] 利用所述卷積神經(jīng)網(wǎng)絡中的優(yōu)化后的鑒別模型對所述多幅待鑒別圖像進行鑒別。
[0010] 本發(fā)明實施例提供一種視頻鑒別系統(tǒng),該系統(tǒng)包括:
[0011] 圖像預處理單元,用于對已知類型的多幅圖像進行預處理,所述預處理至少包括 數(shù)據(jù)增廣;
[0012] 圖像鑒別訓練單元,用于將預處理后的圖像輸入到卷積神經(jīng)網(wǎng)絡中利用鑒別模型 進行類型鑒別訓練,根據(jù)類型鑒別結(jié)果和所述已知類型優(yōu)化所述鑒別模型;
[0013] 待鑒別圖像獲取單元,用于獲取多幅待鑒別圖像;
[0014] 圖像鑒別單元,用于利用所述卷積神經(jīng)網(wǎng)絡中的優(yōu)化后的鑒別模型對所述多幅待 鑒別圖像進行鑒別。
[0015] 由于卷積神經(jīng)網(wǎng)絡存在自己學習的功能,隨著其泛化能力的增強,利用深層次的 神經(jīng)網(wǎng)絡進行目標的識別與分類的精度也會隨之不斷的增強,因此,本發(fā)明將卷神經(jīng)網(wǎng)絡 作為識別的主要工具,通過增廣的圖像鑒別訓練,增強了卷積神經(jīng)網(wǎng)絡的模型的泛化能力。 相比于傳統(tǒng)的復雜的計算識別模型來說,卷積神經(jīng)網(wǎng)絡及其模型運用起來更加簡單高效。 同時通過利用上述優(yōu)化后的卷積神經(jīng)網(wǎng)絡進行鑒別,提高了視頻鑒別的準確率和速度。
【附圖說明】
[0016] 為了更清楚地說明本發(fā)明實施例的技術(shù)方案,下面將對實施例描述中所需要使用 的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實施例,對于本領(lǐng) 域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附 圖。
[0017] 圖1為根據(jù)本發(fā)明一個實施例的視頻鑒別方法流程圖;
[0018] 圖2為根據(jù)本發(fā)明一個實施例的獲取多幅待鑒別圖像流程圖;
[0019] 圖3(a)為根據(jù)本發(fā)明一個實施例的數(shù)據(jù)增廣過程中圖像旋轉(zhuǎn)45度、裁剪和放大處 理的不意圖;
[0020] 圖3(b)為根據(jù)本發(fā)明一個實施例的將一幅圖像增廣為八幅圖像的示意圖;
[0021] 圖4為根據(jù)本發(fā)明一個實施例的生成低亮度圖像的流程圖;
[0022] 圖5為根據(jù)本發(fā)明一個實施例的獲取多幅待鑒別圖像的流程圖;
[0023] 圖6為根據(jù)本發(fā)明一個實施例的視頻鑒別系統(tǒng)結(jié)構(gòu)示意圖;
[0024] 圖7為根據(jù)本發(fā)明一個實施例的待鑒別圖像生成單元的結(jié)構(gòu)圖。 具體實施例
[0025]為使本發(fā)明實施例的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合本發(fā)明實施例 中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例是 本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員 在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0026] 如圖1所示,視頻鑒別方法可以包括如下步驟:
[0027] 步驟11:對已知類型的多幅圖像進行預處理,所述預處理至少包括數(shù)據(jù)增廣;
[0028]步驟12:將預處理后的多幅圖像輸入到卷積神經(jīng)網(wǎng)絡中利用鑒別模型進行類型鑒 別訓練,根據(jù)類型鑒別結(jié)果和所述已知類型優(yōu)化所述鑒別模型;
[0029] 步驟13:獲取多幅待鑒別圖像,其中,待鑒別圖像的幅數(shù)可以按實際情況確定為一 幅或者多幅;
[0030] 步驟14:利用所述卷積神經(jīng)網(wǎng)絡中的優(yōu)化后的鑒別模型對所述待鑒別圖像進行鑒 別。
[0031] 本實施例可以用于鑒別冗余、重復、侵犯知識產(chǎn)權(quán)、血腥、暴力、恐怖或淫穢等非法 視頻內(nèi)容。
[0032]由于卷積神經(jīng)網(wǎng)絡存在自己學習的功能,隨著其泛化能力的增強,利用深層次的 神經(jīng)網(wǎng)絡進行目標的識別與分類的精度也會隨之不斷的增強,因此,本發(fā)明將卷神經(jīng)網(wǎng)絡 作為識別的主要工具,通過增廣的圖像鑒別訓練,增強了卷積神經(jīng)網(wǎng)絡的模型的泛化能力。 相比于傳統(tǒng)的復雜的計算識別模型來說,卷積神經(jīng)網(wǎng)絡及其模型運用起來更加簡單高效。 同時通過利用上述優(yōu)化后的卷積神經(jīng)網(wǎng)絡進行鑒別,提高了視頻鑒別的準確率和速度。
[0033] 如圖2所示,獲取待鑒別圖像(即圖1中步驟13)可以包括:
[0034] 步驟131:提取待鑒別視頻中的第一數(shù)量的關(guān)鍵圖像幀;
[0035] 步驟132:將所述第一數(shù)量(例如Xl)與設定的閾值(例如Y)進行比較,確定第二數(shù) 量(例如X2)的關(guān)鍵圖像幀;
[0036]步驟133:對所述第二數(shù)量的關(guān)鍵圖像幀進行解碼,生成一系列圖像;
[0037]步驟134:基于所述一系列圖像進行歸一化處理以生成多幅待鑒別圖像。
[0038] 為了使卷積神經(jīng)網(wǎng)絡能夠應對視頻的鑒別任務,本發(fā)明實施例通過提取視頻的一 定數(shù)量的關(guān)鍵圖像幀,并對關(guān)鍵圖像幀的數(shù)量設定閾值,滿足條件的視頻圖像幀才進行解 碼和后續(xù)的鑒別。本發(fā)明實施例在保證了圖像幀質(zhì)量(關(guān)鍵幀)的前提下,減少圖像幀的數(shù) 量,降低的數(shù)據(jù)運算量,減少了數(shù)據(jù)運算時間,降低了處理器的運算負荷,使得硬件成本較 低的配置也能承擔視頻鑒別的任務。
[0039] 在一些實施例中,視頻鑒別方法可以包括:
[0040] 步驟11':獲取待鑒別圖像;
[0041]步驟12':將預處理后的圖像批量輸入到卷積神經(jīng)網(wǎng)絡中利用鑒別模型進行鑒別, 并根據(jù)鑒別結(jié)果更新鑒別模型;
[0042] 步驟13':利用更新后的鑒別模型進行下一輪待鑒別視頻的鑒別。
[0043] 在一些實施例中,獲取待鑒別圖像(步驟11')可以包括:
[0044] 步驟111' :提取待鑒別視頻中的第一數(shù)量的關(guān)鍵圖像幀;
[0045] 步驟112':將所述第一數(shù)量與設定的閾值進行比較,確定第二數(shù)量的關(guān)鍵圖像幀;
[0046] 步驟113':對所述第二數(shù)量的關(guān)鍵圖像幀進行解碼,生成一系列圖像;
[0047]步驟114':對所述一系列圖像進行預處理,所述預處理包括數(shù)據(jù)增廣和逐圖像均 值消減。
[0048]由此,本實施例可以增強鑒別模型的不斷的自我學習、自我更新,可以進一步提高 后期的鑒別準確度。
[0049] 為了提高卷積神經(jīng)網(wǎng)絡中鑒別模型的泛化能力,對鑒別模型進行訓練,從而增加 圖片識別的精度,本實施例對圖片進行了有效的數(shù)據(jù)增廣。數(shù)據(jù)增廣例如包括旋轉(zhuǎn)、隨機裁 剪、縮放或顏色抖動等。其中,
【申請人】發(fā)現(xiàn),等角度旋轉(zhuǎn)相比于水平及垂直方向上的翻轉(zhuǎn)而 言,泛化能力和準確性更強。
[0050] 為了能夠形象的體現(xiàn)圖像的方向且說理簡單,下面在圖3(a)和圖3(b)中以豎直向 上的箭頭的圖像1為例,具體說明對該圖像進行數(shù)據(jù)增廣的實現(xiàn)方式。
[0051] 如圖3(a)所示,首先將圖像1(其尺寸與顯示頻的尺寸相匹配)順時針旋轉(zhuǎn)45度得 到圖像a。顯然,圖像a的尺寸與顯示屏不再匹配。為了將圖像a的尺寸統(tǒng)一為與顯示屏相匹 配的尺寸,且最大限度的保護信息的完整性,本實施例在圖像a中裁剪出圖像b,然后,再將 圖像b放大為圖像2。
[0052]由此,本實施例通過旋轉(zhuǎn)、裁剪和放大處理,將圖像1增廣為圖像2,且有效的保存 了有效信息(通常屏幕中間的信息是有效信息,例如豎直向上的箭頭)。
[0053]同理,如圖3(b)所示,將圖2順時針旋轉(zhuǎn)45度,再通過上述的裁剪和放大處理后,可 以將圖像1增廣為圖像3。當然也可以直接將圖像1順時針旋轉(zhuǎn)90度后,再通過裁剪和放大處 理,將圖像1增廣為圖像3。
[0054]本實施例使用等角度旋轉(zhuǎn)、裁剪和縮放的方式,對原始關(guān)鍵圖像(圖像1)逆時針或 者順時針每次旋轉(zhuǎn)45度,在完成一周360度的旋轉(zhuǎn)處理后,可以分別得到圖像2、圖像3、圖像 4、圖像5、圖像6、圖像7和圖像8。此時,一張原始圖像,就可以變成了八張圖像,大幅度增加 了圖像的數(shù)據(jù)量,增強了模型的泛化能力,進而提高了卷積神經(jīng)網(wǎng)絡訓練模型的準確度。
[0055] 本實施例可以對卷積神經(jīng)網(wǎng)絡模型進行訓練,以增強其泛化能力和魯棒性。再利 用訓練之后的模型對圖像進行批量識別,可以提高視頻鑒別的準確率,并能加快了視頻鑒 別速度。
[0056] 在本實施例中,對卷積神經(jīng)網(wǎng)絡模型進行訓練可以采用數(shù)據(jù)增廣的方式(該數(shù)據(jù) 增廣的操作也可以在訓練之前完成)。數(shù)據(jù)增廣方式可以包括等角度旋轉(zhuǎn)、裁剪和縮放等。 [0057]其中,為了進一步提高卷積神經(jīng)網(wǎng)絡訓練模型的泛化能力,可以通過減小旋轉(zhuǎn)角 度來增加增廣的數(shù)據(jù)量。例如,將角度由45度調(diào)整為10度,這樣一張原始圖像,之前只能增 廣為8幅圖像,而現(xiàn)在卻能增廣為36幅圖像,這樣可以增加數(shù)據(jù)量,提高卷積神經(jīng)網(wǎng)絡訓練 模型的泛化能力,進而會提高后期圖像識別的精度,但是這樣做會增加數(shù)據(jù)運算量,導致訓 練的時間增長。
[0058]同理,可以通過增大旋轉(zhuǎn)角度來減少增廣的數(shù)據(jù)量。例如,將角度由45度調(diào)整為90 度,這樣一張原始圖像,之前可以增廣為8幅圖像,而現(xiàn)在卻只能增廣為4幅圖像,雖然訓練 的速度會有所提高,但這會影響卷積神經(jīng)網(wǎng)絡訓練模型的泛化能力,進而會影響后期視頻 鑒別的準確度。
[0059]由此,經(jīng)過大量的試驗數(shù)據(jù)證明,旋轉(zhuǎn)的角度為45度時,訓練的時間和視頻鑒別的 精度會達到相對平衡的優(yōu)化效果。
[0060] 圖4為根據(jù)本發(fā)明一個實施例的生成低亮度圖像的流程圖。數(shù)據(jù)增廣還包括圖像 亮度處理,本實施例中,針對需要鑒別視頻中是否包含色情內(nèi)容的要求,可以在訓練樣本 (即已知類型的圖像,例如針對色情內(nèi)容,訓練樣本就是色情圖片)中,人為增加一些亮度較 低的樣本圖像(由于關(guān)于色情的視頻內(nèi)容通常在昏暗的環(huán)境下,所以圖像的亮度較低)。亮 度較低的樣本圖像是由現(xiàn)有樣本的副本通過降低圖像的亮度處理生成的。如圖4所示,圖像 亮度處理包括:
[0061] 步驟41:獲取多幅圖像的每幅圖像像素的灰度值ga(i),(i = l、2、3"_n)。
[0062] 例如,10幅圖像通過45度等角度旋轉(zhuǎn)后可以形成80幅圖像。統(tǒng)計第1至80幅圖像的 灰度值ga(l)、ga(2)......ga(80)。
[0063] 步驟42:根據(jù)多幅圖像的每幅圖像像素的灰度值,確定多幅圖像的灰度均值ga。
[0064] 步驟43:將所述各個灰度值分別與所述灰度均值進行比較,當存在某一灰度值大 于所述灰度均值時,針對所述某一灰度值所對應的圖像,生成亮度較低的圖像副本。
[0065]具體的,確定所有圖像(例如80幅)的灰度均值ga的計算公式可以如下: 1 λ-1·
[0066] 辟.=-S '0. .299 * 左;+ '0. 587 * 巧 + 0· 11.4 * 為 η ?=ο '
[0067] 其中,η是樣本圖像總數(shù),Ri、Gi、Bi分別為當前樣本圖像r、g、b分量值。其中Ri、Gi、 Bi為二維矩陣,其大小分別對應圖像的長和寬。需要分別對矩陣的每個元素進行處理,即對 圖像的每個像素點進行處理。
[0068] 在本實施例中,圖像變換公式如下所示:
[0069]
[0070] 經(jīng)過上述處理后,增加了與亮度較高的圖像樣本對應的亮度低的樣本,一方面豐 富了樣本總數(shù),另一方面也增加了卷積神經(jīng)網(wǎng)絡最終模型的泛化能力和魯棒性,提高了后 期的視頻鑒別的準確度。
[0071] 當然,上述方法還可以根據(jù)所有圖像像素點的灰度值來先統(tǒng)計所有圖像的灰度均 值,然后再計算各個圖像的灰度均值,也可以達到本發(fā)明的目的,只是,運算時間比上述方 式要長。
[0072]在一些實施例中,預處理還包括:逐圖像均值消減(例如對圖像的R、G和B的數(shù)值進 行消減)或者利用顏色抖動(color jitter)的方法對圖像做進一步預處理。這樣做便于數(shù) 據(jù)加工和處理(可以是歸一化數(shù)據(jù)處理方式),加快視頻鑒別的速度。
[0073] 如圖5所示,本實施例的提取待鑒別視頻中的第一數(shù)量的關(guān)鍵圖像幀的步驟(即圖 2中步驟131)可以包括如下步驟:
[0074] 步驟1311:提取待鑒別視頻的多幅圖像幀。
[0075]步驟1312:從多幅圖像幀中篩選出第一數(shù)量的關(guān)鍵圖像幀。
[0076]本實施例中的視頻是由一系列圖像幀組成。如果視頻幀率為25f ps,那么每秒鐘的 視頻就有25張圖片。如果視頻時長很長,那么該視頻包含的圖像幀的數(shù)量就會非常巨大。本 實施例通過從提取的待鑒別視頻的多幅圖像幀中篩選出第一數(shù)量的關(guān)鍵圖像幀(包含完 整、清晰的圖像信息),使得篩選出的關(guān)鍵圖像幀不僅能夠很好的適用于檢測任務,提高檢 測準確度,減少檢測時間,而且便于后續(xù)的圖像鑒別處理。
[0077]具體的,在一些實施例中,為了控制關(guān)鍵幀數(shù)量,防止一些全I幀(MPEG編碼中的內(nèi) 部編碼幀,代表一個完整的畫面)的視頻含有過多的關(guān)鍵幀影響檢測速度,本實施例限制了 最大關(guān)鍵幀數(shù)量。為了提高視頻鑒別的精度和減少鑒別的時間,本發(fā)明實施例參考大量的 實驗數(shù)據(jù)(例如鑒別速度和鑒別時間),閾值Y優(yōu)選為5000。
[0078] 具體的,如果本實施例中的Xl取值1000時,此時Xl < Y,說明Xl沒有超出閾值范圍, 那么,X2的值也取1000,此時,可以對提取的待鑒別視頻中的1000張的關(guān)鍵圖像幀進行全部 解碼。
[0079] 如果X1取值為20000時,此時XI >Y時,說明X1已經(jīng)超出閾值范圍,這會影響視頻審 核的速度。因此,確定X2為Xl的N分之一,以使所述第二數(shù)量小于或者等于所述閾值,其中,N 為大于或者等于二的整數(shù)。N在具體取值時,可以按運算的精度或者時間要求,進行自定義。 例如,N取10時,只需要對待鑒別視頻中的20000張的關(guān)鍵圖像幀中的2000張圖像幀進行解 碼。
[0080]由此,本實施例通過設定閾值,對需要解碼的關(guān)鍵圖像幀進行數(shù)量控制,在盡量多 的提取樣本(關(guān)鍵圖像幀)的前提下,防止因樣本數(shù)量增多帶來的鑒別速度下降的問題。當 然,如果硬件配置較高,處理器運算速度較快時,可以將閾值設置得足夠大,以提高視頻鑒 別準確度。
[0081 ]在一些實施例中,歸一化處理包括對所述一系列圖像進行逐圖像均值消減。
[0082] 在一些實施例中,可以通過將解碼的圖像進行緩存,然后對批量的圖像進行并行 檢測,來提高了視頻檢測的速度。
[0083] 具體的,在進行批量檢測時,首先提取視頻一定數(shù)量(batch_size)的關(guān)鍵幀、之后 將這批關(guān)鍵幀送入卷積神經(jīng)網(wǎng)絡模型進行檢測。在檢測的同時,多線程并行地準備下一批 關(guān)鍵幀,這樣可以大幅度節(jié)省時間。此外,當最后一批關(guān)鍵幀數(shù)量不足時(即最后一批關(guān)鍵 幀數(shù)量小于batch_si Ze時),不足的部分可以用純黑色圖像補齊。
[0084] 如圖6所示,視頻鑒別系統(tǒng)可以包括:圖像預處理單元、圖像鑒別訓練單元、待鑒別 圖像獲取單元和圖像鑒別單元。其中:
[0085]圖像預處理單元用于對已知類型的多幅圖像進行預處理,所述預處理至少包括數(shù) 據(jù)增廣。
[0086]圖像鑒別訓練單元用于將預處理后的圖像輸入到卷積神經(jīng)網(wǎng)絡中利用鑒別模型 進行類型鑒別訓練,根據(jù)類型鑒別結(jié)果和所述已知類型優(yōu)化所述鑒別模型。
[0087] 待鑒別圖像獲取單元用于獲取多幅待鑒別圖像。
[0088] 圖像鑒別單元用于利用所述卷積神經(jīng)網(wǎng)絡中的優(yōu)化后的鑒別模型對所述多幅待 鑒別圖像進行鑒別。
[0089] 在一些實施例中,所述待鑒別圖像獲取單元可以包括:關(guān)鍵圖像幀提取模塊、關(guān)鍵 圖像幀確定模塊、圖像解碼模塊和待鑒別圖像生成模塊。其中:
[0090] 關(guān)鍵圖像幀提取模塊用于提取待鑒別視頻中的第一數(shù)量的關(guān)鍵圖像幀。
[0091] 關(guān)鍵圖像幀確定模塊用于將所述第一數(shù)量與設定的閾值進行比較,確定第二數(shù)量 的關(guān)鍵圖像幀。
[0092] 圖像解碼模塊用于對所述第二數(shù)量的關(guān)鍵圖像幀進行解碼,生成一系列圖像。 [0093]待鑒別圖像生成模塊用于基于所述一系列圖像進行歸一化處理以生成待鑒別圖 像。
[0094]在一些實施例中,所述數(shù)據(jù)增廣至少包括:等角度旋轉(zhuǎn),較佳的,所述等角度為45 度。
[0095]在一些實施例中,所述數(shù)據(jù)增廣還包括圖像亮度處理,所述圖像亮度處理包括:
[0096] 獲取所述多幅圖像的每幅圖像像素的灰度值;
[0097] 根據(jù)所述多幅圖像的每幅圖像像素的灰度值,確定所述多幅圖像的灰度均值;
[0098] 將所述各個灰度值分別與所述灰度均值進行比較,當存在某一灰度值大于所述灰 度均值時,針對所述某一灰度值所對應的圖像,生成亮度較低的圖像副本。
[0099]在一些實施例中,所述預處理還包括逐圖像均值消減。
[0100] 在一些實施例中,關(guān)鍵圖像幀提取單元用于提取待鑒別視頻的多幅圖像幀;以及 從所述多幅圖像幀中篩選出第一數(shù)量的關(guān)鍵圖像幀。
[0101] 在一些實施例中,關(guān)鍵圖像幀確定單元用于:
[0102] 當所述比較模塊判定所述第一數(shù)量小于或者等于設定的閾值時,所述確定模塊確 定第二數(shù)量為第一數(shù)量;以及
[0103] 當所述比較模塊判定所述第一數(shù)量大于設定的閾值時,所述確定模塊確定第二數(shù) 量為第一數(shù)量的N分之一,以使所述第二數(shù)量小于或者等于所述閾值,其中,N為大于或者等 于二的整數(shù)。
[0104] 在一些實施例中,歸一化處理包括逐圖像均值消減。
[0105] 由于上述實施例的視頻鑒別系統(tǒng)與視頻鑒別方法的功能相對應,在此,不再贅述 視頻鑒別系統(tǒng)與視頻鑒別方法相關(guān)的內(nèi)容。本發(fā)明實施例中可以通過硬件處理器 (hardware processor)來實現(xiàn)相關(guān)功能模塊。
[0106] 以上所描述的裝置實施例僅僅是示意性的,其中所述作為分離部件說明的單元可 以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單 元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡單元上。可以根據(jù)實際的需要選擇其 中的部分或者全部模塊來實現(xiàn)本實施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性 的勞動的情況下,即可以理解并實施。
[0107]通過以上的實施例的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到各實施例可借助 軟件加必需的通用硬件平臺的方式來實現(xiàn),當然也可以通過硬件?;谶@樣的理解,上述技 術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算 機軟件產(chǎn)品可以存儲在計算機可讀存儲介質(zhì)中,如R0M/RAM、磁碟、光盤等,包括若干指令用 以使得一臺計算機設備(可以是個人計算機,服務器,或者網(wǎng)絡設備等)執(zhí)行各個實施例或 者實施例的某些部分所述的方法。
[0108]最后應說明的是:以上實施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡管 參照前述實施例對本發(fā)明進行了詳細的說明,本領(lǐng)域的普通技術(shù)人員應當理解:其依然可 以對前述各實施例所記載的技術(shù)方案進行修改,或者對其中部分技術(shù)特征進行等同替換; 而這些修改或者替換,并不使相應技術(shù)方案的本質(zhì)脫離本發(fā)明各實施例技術(shù)方案的精神和 范圍。
【主權(quán)項】
1. 一種視頻鑒別方法,包括: 對已知類型的多幅圖像進行預處理,所述預處理至少包括數(shù)據(jù)增廣; 將預處理后的多幅圖像輸入到卷積神經(jīng)網(wǎng)絡中利用鑒別模型進行類型鑒別訓練,根據(jù) 類型鑒別結(jié)果和所述已知類型優(yōu)化所述鑒別模型; 獲取待鑒別圖像; 利用所述卷積神經(jīng)網(wǎng)絡中的優(yōu)化后的鑒別模型對所述待鑒別圖像進行鑒別。2. 根據(jù)權(quán)利要求1所述的方法,其中,所述數(shù)據(jù)增廣至少包括:等角度旋轉(zhuǎn)。3. 根據(jù)權(quán)利要求2所述的方法,其中,所述等角度為45度。4. 根據(jù)權(quán)利要求2所述的方法,其中,所述數(shù)據(jù)增廣還包括圖像亮度處理,所述圖像亮 度處理包括: 獲取所述多幅圖像的每幅圖像像素的灰度值; 根據(jù)所述多幅圖像的每幅圖像像素的灰度值,確定所述多幅圖像的灰度均值; 將所述各個灰度值分別與所述灰度均值進行比較,當存在某一灰度值大于所述灰度均 值時,針對所述某一灰度值所對應的圖像,生成亮度較低的圖像副本。5. 根據(jù)權(quán)利要求1所述的方法,其中,所述預處理還包括:逐圖像均值消減。6. 根據(jù)權(quán)利要求1-5中任一項所述的方法,其中,所述獲取多幅待鑒別圖像包括: 提取待鑒別視頻中的第一數(shù)量的關(guān)鍵圖像幀; 將所述第一數(shù)量與設定的閾值進行比較,確定第二數(shù)量的關(guān)鍵圖像幀; 對所述第二數(shù)量的關(guān)鍵圖像幀進行解碼,生成一系列圖像; 基于所述一系列圖像進行歸一化處理以生成多幅待鑒別圖像。7. 根據(jù)權(quán)利要求6所述的方法,其中,所述提取待鑒別視頻中的第一數(shù)量的關(guān)鍵圖像幀 包括: 提取待鑒別視頻的多幅圖像幀; 從所述多幅圖像幀中篩選出第一數(shù)量的關(guān)鍵圖像幀。8. 根據(jù)權(quán)利要求6所述的方法,其中,所述將所述第一數(shù)量與設定的閾值進行比較,確 定第二數(shù)量的關(guān)鍵圖像幀包括: 當所述第一數(shù)量小于或者等于設定的閾值時,確定第二數(shù)量為第一數(shù)量; 當所述第一數(shù)量大于設定的閾值時,確定第二數(shù)量為第一數(shù)量的N分之一,以使所述第 二數(shù)量小于或者等于所述閾值,其中,N為大于或者等于二的整數(shù)。9. 根據(jù)權(quán)利要求6所述的方法,其中,所述歸一化處理包括:逐圖像均值消減。10. -種視頻鑒別系統(tǒng),包括: 圖像預處理單元,用于對已知類型的多幅圖像進行預處理,所述預處理至少包括數(shù)據(jù) 增廣; 圖像鑒別訓練單元,用于將預處理后的圖像輸入到卷積神經(jīng)網(wǎng)絡中利用鑒別模型進行 類型鑒別訓練,根據(jù)類型鑒別結(jié)果和所述已知類型優(yōu)化所述鑒別模型; 待鑒別圖像獲取單元,用于獲取待鑒別圖像; 圖像鑒別單元,用于利用所述卷積神經(jīng)網(wǎng)絡中的優(yōu)化后的鑒別模型對所述待鑒別圖像 進行鑒別。11. 根據(jù)權(quán)利要求10所述的系統(tǒng),其中,所述數(shù)據(jù)增廣至少包括:等角度旋轉(zhuǎn)。12. 根據(jù)權(quán)利要求11所述的系統(tǒng),其中,所述等角度為45度。13. 根據(jù)權(quán)利要求11所述的系統(tǒng),其中,所述數(shù)據(jù)增廣還包括圖像亮度處理,所述圖像 亮度處理包括: 獲取所述多幅圖像的每幅圖像像素的灰度值; 根據(jù)所述多幅圖像的每幅圖像像素的灰度值,確定所述多幅圖像的灰度均值; 將所述各個灰度值分別與所述灰度均值進行比較,當存在某一灰度值大于所述灰度均 值時,針對所述某一灰度值所對應的圖像,生成亮度較低的圖像副本。14. 根據(jù)權(quán)利要求10所述的系統(tǒng),其中,所述預處理還包括:逐圖像均值消減。15. 根據(jù)權(quán)利要求10-14中任一項所述的系統(tǒng),其中,所述待鑒別圖像獲取單元包括: 關(guān)鍵圖像幀提取模塊,用于提取待鑒別視頻中的第一數(shù)量的關(guān)鍵圖像幀; 關(guān)鍵圖像幀確定模塊,用于將所述第一數(shù)量與設定的閾值進行比較,確定第二數(shù)量的 關(guān)鍵圖像幀; 圖像解碼模塊,用于對所述第二數(shù)量的關(guān)鍵圖像幀進行解碼,生成一系列圖像; 待鑒別圖像生成模塊,用于基于所述一系列圖像進行歸一化處理以生成待鑒別圖像。16. 根據(jù)權(quán)利要求15所述的系統(tǒng),其中,所述關(guān)鍵圖像幀提取單元用于: 提取待鑒別視頻的多幅圖像幀;以及 從所述多幅圖像幀中篩選出第一數(shù)量的關(guān)鍵圖像幀。17. 根據(jù)權(quán)利要求15所述的系統(tǒng),其中,所述關(guān)鍵圖像幀確定單元用于: 當所述比較模塊判定所述第一數(shù)量小于或者等于設定的閾值時,所述確定模塊確定第 二數(shù)量為第一數(shù)量;以及 當所述第一數(shù)量大于設定的閾值時,確定第二數(shù)量為第一數(shù)量的N分之一,以使所述第 二數(shù)量小于或者等于所述閾值,其中,N為大于或者等于二的整數(shù)。18. 根據(jù)權(quán)利要求15所述的系統(tǒng),其中,所述歸一化處理包括:逐圖像均值消減。
【文檔編號】G06K9/00GK105844238SQ201610168258
【公開日】2016年8月10日
【申請日】2016年3月23日
【發(fā)明人】劉陽, 白茂生, 魏偉, 李興玉
【申請人】樂視云計算有限公司