基于多尺度hog的行人檢測(cè)方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種基于多尺度H0G的行人檢測(cè)方法,屬于計(jì)算機(jī)視覺(jué)中行人檢測(cè)技 術(shù)領(lǐng)域。
【背景技術(shù)】
[0002] 行人檢測(cè)是計(jì)算機(jī)視覺(jué)領(lǐng)域內(nèi)的一個(gè)十分重要的分支,是最近十幾年來(lái)的研究熱 點(diǎn)和難點(diǎn)。行人檢測(cè)擁有非常廣闊的應(yīng)用前景,如視頻的智能監(jiān)控、汽車(chē)的輔助駕駛和家居 智能服務(wù)等,存在巨大的商業(yè)價(jià)值。雖然經(jīng)過(guò)十幾年的發(fā)展已經(jīng)有了一些初步的研究成果, 但仍然存在很多尚未解決的難點(diǎn),且目前還沒(méi)有一種行人檢測(cè)系統(tǒng)能夠在任何環(huán)境和背景 下通用。
[0003] 近年來(lái),基于機(jī)器學(xué)習(xí)的行人檢測(cè)方法已經(jīng)成為行人檢測(cè)領(lǐng)域中主流的研究方 向。主要包括兩個(gè)重要方面,一個(gè)是特征描述算子,另一個(gè)是學(xué)習(xí)算法。特征描述算子有 haar-like、H0G(梯度方向直方圖)、LBP(局部二值模式)以及edgelet(邊緣特征)等。學(xué) 習(xí)算法有支持向量機(jī)(SVM)和級(jí)聯(lián)分類(lèi)器Adaboost?,F(xiàn)有的行人檢測(cè)技術(shù)有著檢測(cè)速度 慢、準(zhǔn)確率不夠高等缺點(diǎn)。
【發(fā)明內(nèi)容】
[0004] 發(fā)明目的:針對(duì)現(xiàn)有技術(shù)中存在的問(wèn)題,本發(fā)明提供了一種檢測(cè)速度快、準(zhǔn)確率高 的基于多尺度H0G的行人檢測(cè)方法。
[0005] 技術(shù)方案:一種基于多尺度H0G的行人檢測(cè)方法,包括以下步驟:
[0006] 步驟1 :采集圖像;
[0007] 步驟2 :對(duì)步驟1中獲得的圖像進(jìn)行像素梯度的計(jì)算;
[0008] 步驟3 :對(duì)步驟2獲得的圖像進(jìn)行單元內(nèi)梯度直方圖的統(tǒng)計(jì);
[0009] 步驟4 :對(duì)步驟3統(tǒng)計(jì)獲得的單元內(nèi)梯度直方圖塊歸一化處理得到塊歸一化直方 圖;
[0010] 步驟5 :對(duì)步驟4得到塊歸一化直方圖提取特征,得到多尺度H0G特征向量;
[0011] 步驟6 :將步驟5獲得的多尺度H0G特征向量送入RBF核-SVM進(jìn)行分類(lèi),輸出分 類(lèi)結(jié)果。
[0012] 進(jìn)一步,所述步驟3中分別采用32X32、16X16以及8X8像素大小的單元進(jìn)行梯 度直方圖統(tǒng)計(jì)。這樣做使得后續(xù)提取出的多尺度H0G特征能夠非常充分的體現(xiàn)行人的細(xì)節(jié) 特征以及整體特征,不僅特征向量的維度大幅度降低,而且使用該特征的分類(lèi)準(zhǔn)確率與H0G 特征基本一致。
[0013] 有益效果:針對(duì)H0G特征的缺點(diǎn),本發(fā)明提出了多尺度H0G特征,運(yùn)用不同尺寸 block和cell提取多尺度H0G特征向量,在保證描述行人性能幾乎未變的前提下,大大降低 了特征的維數(shù),提高了系統(tǒng)的效率。
【附圖說(shuō)明】
[0014] 圖1為本發(fā)明的流程示意圖。
【具體實(shí)施方式】
[0015] 下面結(jié)合具體實(shí)施例,進(jìn)一步闡明本發(fā)明,應(yīng)理解這些實(shí)施例僅用于說(shuō)明本發(fā)明 而不用于限制本發(fā)明的范圍,在閱讀了本發(fā)明之后,本領(lǐng)域技術(shù)人員對(duì)本發(fā)明的各種等價(jià) 形式的修改均落于本申請(qǐng)所附權(quán)利要求所限定的范圍。
[0016] 如圖1所示,基于特征融合的行人檢測(cè)方法,其步驟如下:
[0017] 步驟1:采集圖像。
[0018] 步驟2 :對(duì)步驟1中獲得的圖像進(jìn)行像素梯度的計(jì)算;
[0019] 計(jì)算圖像的一階梯度。計(jì)算導(dǎo)數(shù)不僅能夠獲得人體輪廓和紋理信息,還能進(jìn)一步 減弱光照的影響。由于H0G特征的運(yùn)算對(duì)模板算子非常的敏感,經(jīng)過(guò)試驗(yàn)對(duì)比發(fā)現(xiàn),反而是 最簡(jiǎn)單的一維離散微分模板(1,〇,+1)及其轉(zhuǎn)置在水平和垂直兩個(gè)方向上對(duì)圖像各個(gè)像素 進(jìn)行梯度計(jì)算能夠取得最好的檢測(cè)效果??梢酝ㄟ^(guò)公式分別計(jì)算像素點(diǎn)(x,y)的梯度模值 和方向角:
[0020]
[0021]
[0022] 其中,G(x,y),α(X,y),H(x,y)分別表示像素點(diǎn)的梯度幅值、梯度方向以及像素點(diǎn) 的灰度值。對(duì)于彩色圖像可以分別計(jì)算它們各個(gè)顏色通道的梯度,選擇其中幅值最大的值 作為該像素點(diǎn)的梯度。
[0023] 步驟3 :對(duì)步驟2獲得的圖像進(jìn)行單元內(nèi)梯度直方圖的統(tǒng)計(jì);
[0024] 該步驟的本質(zhì)是對(duì)局部圖像區(qū)域編碼,且可以保持對(duì)圖像中人體對(duì)象的外觀和 姿勢(shì)的弱敏感性。我們把圖像窗口劃分為若干個(gè)小區(qū)域,這些小區(qū)域被稱(chēng)為"單元格",即 cell。把圖像平均分成若干正方形的單元格(cell),cell的長(zhǎng)和寬依次為所使用的block 的一半長(zhǎng)度,分別為32X32、16X16以及8X8像素大小。假設(shè)每個(gè)細(xì)胞包含8X8個(gè)像素, 每個(gè)單元格內(nèi)把的梯度方向平均分成9個(gè)區(qū)間(bin),然后在每個(gè)cell內(nèi)所有像素 的梯度值再分別在各個(gè)bin區(qū)間進(jìn)行直方圖統(tǒng)計(jì),這樣一個(gè)cell得到一個(gè)9維的特征向 量。
[0025] 步驟4:對(duì)步驟3統(tǒng)計(jì)獲得的單元內(nèi)梯度直方圖塊歸一化處理得到塊歸一化直方 圖;
[0026]梯度值的變化范圍非常廣的主要原因是由于圖像中局部的曝光率和前景-背景 的對(duì)比度的多樣化。因而要得到好的檢測(cè)效果,必須進(jìn)行有效地局部對(duì)比標(biāo)準(zhǔn)化。標(biāo)準(zhǔn)化 的方法有很多,一般的方法都是將一組cell放到一個(gè)塊中,然后分別標(biāo)準(zhǔn)化每個(gè)塊。2X2 個(gè)cell形成一個(gè)塊,這樣一個(gè)塊就形成36維的特征向量,再利用L2-范數(shù)對(duì)整個(gè)塊進(jìn)行歸 一化,得到最終的特征向量。
[0027] 步驟5 :對(duì)步驟4得到塊歸一化直方圖提取特征,得到多尺度H0G特征向量;
[0028] 實(shí)施例中采集的圖像為64X128,cell依次為32X32、16X16以及8X8像素大 小,block依次為64X64、32X32以及16X16像素大小,那么一幅圖像就包含42個(gè)block, 每個(gè)b1ock是36維向量,所以一幅64X128大小的圖像的多尺度HOG特征向量為36X42 = 1512維。而在原始HOG特征中,cell為8X8,block為16X16,那么一幅圖像就包含105個(gè) 塊,每個(gè)塊是36維向量,所以一幅64X128大小的圖像的HOG特征向量為36X105 = 3780 維。
[0029] 步驟6:將步驟5獲得的多尺度H0G特征向量送入RBF核-SVM進(jìn)行分類(lèi),輸出分 類(lèi)結(jié)果。
[0030] 實(shí)驗(yàn)將本發(fā)明提出的多尺度H0G特征與原始H0G特征在檢測(cè)率、漏報(bào)率、虛警率和 分類(lèi)時(shí)間等四個(gè)方面進(jìn)行比較,結(jié)果如表1所示。 fP7"V
[0031] 1.檢測(cè)率表示測(cè)試正負(fù)樣本被正確分類(lèi)的概率; FN
[0032] 2.漏報(bào)率:表示測(cè)試的正樣本被錯(cuò)分類(lèi)為負(fù)樣本的概率; JP+FN, FP
[0033]3.虛警率:Fp^TN表示測(cè)試的負(fù)樣本被錯(cuò)分類(lèi)為正樣本的概率;
[0034] 其中,TP(truepositive)表示行人樣本被正確分類(lèi)為行人;FP(falsepositive) 表示非行人樣本被錯(cuò)誤分類(lèi)為行人;TN(truenegative)表示非行人樣本被正確分類(lèi)為非 行人;FN(falsenegative)表示行人樣本被錯(cuò)誤的分類(lèi)為非行人。
[0035] 從表1中我們可以發(fā)現(xiàn)多尺度H0G特征在維數(shù)上比H0G特征減少了大約3/5,前者 1512維,后者3780維;在檢測(cè)時(shí)間方面,多尺度H0G特征為151ms,H0G特征為227ms,多尺 度HOG特征相比較于HOG特征而言,分類(lèi)器的分類(lèi)速度前者高于后者;同時(shí)分別對(duì)比二者的 漏檢率和虛警率,可以發(fā)現(xiàn)多尺度H0G特征樣本的檢測(cè)正確率與H0G差不多;漏檢率有所下 降,虛警率略有升高。本發(fā)明提出的多尺度H0G特征在檢測(cè)的效率方面優(yōu)于H0G特征,而檢 測(cè)的正確率方面與H0G特征類(lèi)似,能夠滿(mǎn)足一般應(yīng)用要求。
[0036]表1
[0037]
【主權(quán)項(xiàng)】
1. 一種基于多尺度HOG的行人檢測(cè)方法,其特征在于,包括以下步驟: 步驟1 :采集圖像; 步驟2 :對(duì)步驟1中獲得的圖像進(jìn)行像素梯度的計(jì)算; 步驟3 :對(duì)步驟2獲得的圖像進(jìn)行單元內(nèi)梯度直方圖的統(tǒng)計(jì); 步驟4 :對(duì)步驟3統(tǒng)計(jì)獲得的單元內(nèi)梯度直方圖塊歸一化處理得到塊歸一化直方圖; 步驟5 :對(duì)步驟4得到塊歸一化直方圖提取特征,得到多尺度HOG特征向量; 步驟6 :將步驟5獲得的多尺度HOG特征向量送入RBF核-SVM進(jìn)行分類(lèi),輸出分類(lèi)結(jié) 果。2. 如權(quán)利要求1所述的基于多尺度HOG的行人檢測(cè)方法,其特征在于,所述步驟3中分 別采用32X32、16X16以及8X8像素大小的單元進(jìn)行梯度直方圖統(tǒng)計(jì)。3. 如權(quán)利要求1所述的基于多尺度HOG的行人檢測(cè)方法,其特征在于,步驟2中通過(guò)公 式分別計(jì)算像素點(diǎn)(x,y)的梯度模值和方向角:其中,G(x,y),a (X,y),H(X,y)分別表示像素點(diǎn)的梯度幅值、梯度方向以及像素點(diǎn)的灰 度值;對(duì)于彩色圖像可以分別計(jì)算它們各個(gè)顏色通道的梯度,選擇其中幅值最大的值作為 該像素點(diǎn)的梯度。
【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種基于多尺度HOG的行人檢測(cè)方法。針對(duì)HOG特征的缺點(diǎn),提出了多尺度HOG特征,運(yùn)用不同尺寸block和cell提取多尺度HOG特征向量,在保證描述行人性能幾乎未變的前提下,大大降低了特征的維數(shù),提高了系統(tǒng)的效率。
【IPC分類(lèi)】G06K9/00, G06K9/62, G06K9/46
【公開(kāi)號(hào)】CN105426819
【申請(qǐng)?zhí)枴緾N201510728940
【發(fā)明人】王敏, 曹瑞
【申請(qǐng)人】河海大學(xué)
【公開(kāi)日】2016年3月23日
【申請(qǐng)日】2015年10月30日