您的位置:新文秘網(wǎng)>>畢業(yè)相關(guān)/畢業(yè)論文/文教論文/調(diào)研報(bào)告/>>正文

畢業(yè)論文:視頻圖像人物識(shí)別算法研究

發(fā)表時(shí)間:2014/3/15 13:10:55
目錄/提綱:……
一、原理概述
二、開(kāi)發(fā)平臺(tái)
三、具體實(shí)現(xiàn)及效果
四、總結(jié)與展望
1、對(duì)于人體的特征描述和提取
3、應(yīng)用:利用筆記本電腦進(jìn)行對(duì)于圖片的識(shí)別
二、軟件平臺(tái)
三、三、具體實(shí)驗(yàn)結(jié)果
……
畢業(yè)論文:視頻圖像人物識(shí)別算法研究

摘要
   視頻圖像中的人物識(shí)別是一種高效、自然且直接的人機(jī)交互的方式。它是研究如何通過(guò)計(jì)算機(jī),使其按照人類(lèi)的思維進(jìn)行邏輯判斷和識(shí)別,尋找出圖像或者視頻中的人物,是現(xiàn)如今在計(jì)算機(jī)視覺(jué)領(lǐng)域非常熱門(mén)的一項(xiàng)研究課題。由于人物的高度靈活性、隨意性以及移動(dòng)高速等特點(diǎn),使得人物識(shí)別成為一項(xiàng)極具挑戰(zhàn)性的課題。目前幾種較為常用的識(shí)別特征算法包括了基于HaarLike特征算法、基于SIFT尺度不變特征算法、基于HOG(Histogram of Orientation Gradient)特征算法和基于HOT(Histogram of Templates)特征算法。較為常用的學(xué)習(xí)匹配算法包括了Adaboost學(xué)習(xí)算法和SVM(Support Vector Machine)支持向量機(jī)算法。本文在研究每一種算法的基礎(chǔ)上,主要針對(duì)HOG特征算法和SVM支持向量機(jī)算法實(shí)現(xiàn)人物識(shí)別。

目 錄
一、原理概述
1.1 背景介紹
1.2 研究現(xiàn)狀
 1.2.1 Haar-Like
 1.2.2 SIFT
 1.2.3 HOG
 1.2.4 Adaboost
 1.2.5 SVM
1.3 本文研究?jī)?nèi)容
1.4 本文結(jié)構(gòu)

二、開(kāi)發(fā)平臺(tái)
2.1 OPENCV
2.1.1 OPENCV簡(jiǎn)介
2.1.2 OPENCV應(yīng)用
2.2 C
2.2.1 C
……(新文秘網(wǎng)http://www.120pk.cn省略975字,正式會(huì)員可完整閱讀)…… 
時(shí)容易產(chǎn)生錯(cuò)誤識(shí)別。因此,實(shí)現(xiàn)人物識(shí)別的挑戰(zhàn)性更大。
   人物識(shí)別中最為重要的技術(shù)就是特征提取。特征一般是通過(guò)對(duì)特征一般是通過(guò)對(duì)需要分類(lèi)的對(duì)象所擁有的知識(shí)進(jìn)行編碼得到的。在物體識(shí)別領(lǐng)域,特征的設(shè)計(jì)始終扮演著重要的角色,之所以采用特征形式作為分類(lèi)的依據(jù),是因?yàn)樘卣髋c原始像素相比具有以下優(yōu)勢(shì):
(1)特征可以表達(dá)區(qū)域之間的關(guān)聯(lián)信息,這是用有限的單個(gè)、獨(dú)立的原始像素
所無(wú)法表示的;
(2)采用特征對(duì)圖像進(jìn)行建模,有利于減小待分類(lèi)對(duì)象的類(lèi)內(nèi)距離,同時(shí)可以
增加待分類(lèi)對(duì)象的類(lèi)間距離,有利于建立更有效的判別函數(shù);
(3)特征更容易形式化,而形式化了的特征計(jì)算更加迅速,這對(duì)于識(shí)別速度有著非常大的正向影響,能夠縮短不少識(shí)別時(shí)間。對(duì)于視頻中的人物識(shí)別或者物體識(shí)別,若是按照像素進(jìn)行則會(huì)極大的加大計(jì)算復(fù)雜度,因?yàn)槊恳粠南袼囟际歉碌模词箖?nèi)容不變,但仍然需要重新計(jì)算,若是按照特征進(jìn)行,一則能夠?qū)⑾袼卣,多個(gè)像素或者一組像素同時(shí)進(jìn)行識(shí)別,二則能夠降低每幀識(shí)別帶來(lái)的不良影響,三則由于要求實(shí)時(shí)性,因此在短時(shí)間內(nèi),識(shí)別系統(tǒng)需要識(shí)別非常大量的窗口,并且計(jì)算對(duì)應(yīng)子窗口中的特征值,所以必須運(yùn)用快速高效的特征計(jì)算方法。因此特征的采用能夠大大提高識(shí)別效率。
   
Haar Like特征提取算法
   Haar Like特征提取算法是由Papageorgiou等人提出的。最早的Haar Like特征提取算法只有三種類(lèi)型,五種形式的矩形特征。分別為:2矩形特征、3矩形特征和4矩形特征。
  
   之后Rainer Lienhart 和Jochen Maydt對(duì)此舉行特征進(jìn)行了擴(kuò)展,加入了旋轉(zhuǎn)45度角度的矩形特征,大致分為4種類(lèi)型:邊緣特征、線(xiàn)性特征、中心環(huán)繞特征和對(duì)角線(xiàn)特征。
  
   若圖像中含有的某個(gè)物體的子圖像區(qū)域是由L*H個(gè)像素組成,那么可以使用一個(gè)五維向量來(lái)表示子圖像中的任意矩形:r=(*,y,l,h,a),其中(*,y)表示矩形左上角定點(diǎn)像素的坐標(biāo),l表示矩形的長(zhǎng)度,h表示矩形的寬度,a則是矩形的旋轉(zhuǎn)角度。此外,其還需要滿(mǎn)足如下條件:
   *≥0
   *+l≤L
   
   
  
   矩形的特征可以用下式表示
   Haar Like特征提取算法主要運(yùn)用在人臉識(shí)別中,少數(shù)情況下會(huì)運(yùn)用于人物識(shí)別,此外,由于其非常良好的矩形模塊性識(shí)別,它頁(yè)經(jīng)常被用于車(chē)輛識(shí)別等矩形物體識(shí)別領(lǐng)域,并且有著非常好的效果。
   具體的識(shí)別過(guò)程可以概括為:首先運(yùn)用大量的Haar Like特征的物體圖像,多以矩形為主,用模式識(shí)別訓(xùn)練出一組級(jí)聯(lián)分類(lèi)器,每級(jí)的識(shí)別率保持統(tǒng)一,這樣能夠傳遞給后級(jí)足夠的具有物體特征的備選物體。Haar Like子分類(lèi)器則由許多相關(guān)特征構(gòu)成,如之前圖片所示,有水平矩形、豎直矩形和任意角度傾斜的矩形,每個(gè)特征含有兩個(gè)分支值和一個(gè)閾值,每級(jí)子分類(lèi)器又含有一個(gè)總閾值。識(shí)別物體的時(shí)候,窗口會(huì)遍歷整幅圖像,其大小與訓(xùn)練時(shí)有物體時(shí)的窗口大小相同,之后逐漸放大窗口,再次遍歷整幅圖像;每次移動(dòng)窗口后,都會(huì)對(duì)窗口內(nèi)的Haar Like特征進(jìn)行計(jì)算,加權(quán)后與分類(lèi)器中Haar Like特征的閾值比較,之后歸類(lèi)進(jìn)入左或者右分支值,將一個(gè)級(jí)的分支值之和與相應(yīng)級(jí)的總閾值比較,若大于該總閾值才可以進(jìn)入下一輪篩選,否則則被淘汰。當(dāng)這個(gè)物體能夠通過(guò)分類(lèi)器所有的級(jí)時(shí),我們認(rèn)為這個(gè)物體能夠以大概率被識(shí)別。
   
SIFT特征提取算法
   SIFT特征(Scale Invariant Feature Transform),全稱(chēng)為尺度不變特征轉(zhuǎn)換。它由D.G.Lowe提出,是一種通過(guò)提取局部特征進(jìn)行識(shí)別的算法,它在尺度空間內(nèi)尋找極值點(diǎn)、提取位置、尺度和旋轉(zhuǎn)不變量。
其主要特點(diǎn)有5點(diǎn):
1 不變性:SIFT特征針對(duì)的是圖像的局部特征,因此需要保證其對(duì)圖像的旋轉(zhuǎn)、尺度縮放、亮度變化等信息能夠做到不受影響。
2 獨(dú)特性:信息量豐富,適用于在海量特征數(shù)據(jù)庫(kù)中進(jìn)行快速、準(zhǔn)確的匹配。
3 多量性:即使少數(shù)的幾個(gè)物體也可以產(chǎn)生大量SIFT特征向量。
4 高速性:經(jīng)優(yōu)化的SIFT匹配算法甚至可以達(dá)到實(shí)時(shí)的要求。
5 可擴(kuò)展性:可以很方便的與其他形式的特征向量進(jìn)行聯(lián)合。
   SIFT特征提取首先檢測(cè)尺度空間的極值點(diǎn),并對(duì)其進(jìn)行精確定位,確保之后能夠?qū)γ總(gè)關(guān)鍵點(diǎn)指定方向參數(shù)。之后針對(duì)每個(gè)關(guān)鍵點(diǎn)生成描述子。
   具體的識(shí)別流程如下:首先生成尺度空間,尺度空間理論目的是模擬圖像數(shù)據(jù)的多尺度特征。高斯卷積核是實(shí)現(xiàn)尺度變換的唯一線(xiàn)性核。之后將會(huì)進(jìn)行圖像金字塔的構(gòu)建,圖像金字塔共O組,每組有S層,下一組的圖像由上一組圖像降采樣得到

   接著需要尋找尺度空間的極值點(diǎn),為了尋找尺度空間的極值點(diǎn),每個(gè)采樣點(diǎn)需要與和它相鄰的所有點(diǎn)進(jìn)行比較,從而能夠得出其是否是它的圖像域和尺度域中相鄰點(diǎn)的極值點(diǎn)。如圖3所示,被檢測(cè)點(diǎn)需要進(jìn)行比較的點(diǎn)包括了:和它同尺度的8個(gè)相鄰點(diǎn)以及上下相鄰尺度對(duì)應(yīng)的18個(gè)點(diǎn),一共26個(gè)點(diǎn),進(jìn)行足夠的比較能夠確保在尺度空間和二維圖像空間都檢測(cè)到極值點(diǎn)。 ……(未完,全文共15229字,當(dāng)前僅顯示2739字,請(qǐng)閱讀下面提示信息。收藏《畢業(yè)論文:視頻圖像人物識(shí)別算法研究》
文章搜索
相關(guān)文章