哈爾特征(Haar-like features) 是用于物體識別的一種數(shù)字圖像特征。它們因為與哈爾小波轉(zhuǎn)換 極為相似而得名,是第一種即時的人臉檢測運算。
簡介哈爾特征(Haar-like features) 是用于物體識別的一種數(shù)字圖像特征。它們因為與哈爾小波轉(zhuǎn)換極為相似而得名,是第一種即時的人臉檢測運算。
歷史上,直接使用圖像的強(qiáng)度(就是圖像每一個像素點的RGB值)使得特征的計算強(qiáng)度很大。1帕帕喬治奧等人提出可以使用基于哈爾小波的特征而不是圖像強(qiáng)度。維奧拉和瓊斯進(jìn)而提出了哈爾特征。哈爾特征使用檢測窗口中指定位置的相鄰矩形,計算每一個矩形的像素和并取其差值。然后用這些差值來對圖像的子區(qū)域進(jìn)行分類。
例如,當(dāng)前有一個人臉圖像集合。通過觀察可以發(fā)現(xiàn),眼睛的顏色要比兩頰的深。因此,用于人臉檢測的哈爾特征是分別放置在眼睛和臉頰的兩個相鄰矩形。這些矩形的位置則通過類似于人臉圖像的外接矩形的檢測窗口進(jìn)行定義。
在維奧拉-瓊斯目標(biāo)檢測框架的檢測階段,一個與目標(biāo)物體同樣尺寸的檢測窗口將在輸入圖像上滑動,在圖像的每一個子區(qū)域都計算一個哈爾特征。然后這個差值會與一個預(yù)先計算好的閾值進(jìn)行比較,將目標(biāo)和非目標(biāo)區(qū)分開來。因為這樣的一個哈爾特征是一個弱分類器(它的檢測正確率僅僅比隨機(jī)猜測強(qiáng)一點點),為了達(dá)到一個可信的判斷,就需要一大群這樣的特征。在維奧拉-瓊斯目標(biāo)檢測框架中,就會將這些哈爾特征組合成一個級聯(lián)分類器,最終形成一個強(qiáng)分類群。
哈爾特征最主要的優(yōu)勢是它的計算非??焖佟J褂靡粋€稱為積分圖的結(jié)構(gòu),任意尺寸的哈爾特征可以在常數(shù)時間內(nèi)進(jìn)行計算。
特征一個矩形哈爾特征可以定義為矩形中幾個區(qū)域的像素和的差值,可以具有任意的位置和尺寸。這種特質(zhì)也被稱為2矩形特征(2-rectangle feature)。 維奧拉和瓊斯也定義了3矩形特征和4矩形特征。這個值表明了圖像的特定區(qū)域的某些特性。每一個特征可以描述圖像上特定特性的存在或不存在,比如邊緣或者紋理的變化。例如,一個2-矩形特征可以表明一個邊界位于一個亮區(qū)域和一個暗區(qū)域之間。
快速計算維奧拉和瓊斯的一個重要貢獻(xiàn)是使用積分圖。2 積分圖是一個二維矩形的查找表,與原始圖像具有一樣的尺寸。積分圖的每一個元素是原始圖像在對應(yīng)位置左上角所有像素的和。這就使得在任意位置計算任意尺寸的矩形的像素和時,只需要進(jìn)行四次查表:
其中點A,B,C,D 屬于原始圖像 I,如圖所示。
每個哈爾特征的查找次數(shù)取決于它的定義。維奧拉和瓊斯的2矩形特征需要六次查詢,3矩形需要八次,而4矩形則需要九次。
傾斜的哈爾特征蘭哈切和梅迪提出了傾斜的(45°)哈爾特征。這種對特征維度的擴(kuò)充是為了提升對物體的檢測。由于這些特征對一些物體的描述更為適合,這種擴(kuò)充是有效的。例如,一個傾斜的特征可以描述一個傾斜45°的邊緣。針對這種特征的計算,也提出了傾斜的積分圖。
本詞條內(nèi)容貢獻(xiàn)者為:
王沛 - 副教授、副研究員 - 中國科學(xué)院工程熱物理研究所