作業名稱(詳解):
1. 影像的資料主要來源有哪些 (列舉幾個即可)
2. sift feature 是什么,可以用來干什么。金字塔匹配思想是什么,可以用來干什么。 hog特征是什么,可以用來干什么。
3. 神經網路早就存再為什么神經網路最近才(提示:從資料和硬體方面考慮)
4. 影像任務有哪些,解決什么樣的影像問題(eg:影像分類就是看圖片中的物體具體是什么。)
作業完成:
1. ImageNet是一個計算機視覺系統識別專案,是目前世界上影像識別最大的資料庫
PASCALVOC 資料集是視覺物件的分類識別和檢測的一個基準測驗,提供了檢測演算法和學習性能的標準影像注釋資料集和標準的評估系統
Labelme資料集的主要特點包括
(1)專門為物體分類識別設計,而非僅僅是實體識別
(2)專門為學習嵌入在一個場景中的物件而設計
(3)高質量的像素級別標注,包括多邊形框(polygons)和背景標注(segmentation masks)
(4)物體類別多樣性大,每種物體的差異性,多樣性也大。
(5)所有影像都是自己通過相機拍攝,而非copy
COCO是一種新的影像識別,分割和加字幕標注的資料集
2.SIFT,即尺度不變特征變換(Scale-invariant feature transform,SIFT),是用于影像處理領域的一種描述。這種描述具有尺度不變性,可在影像中檢測出關鍵點,是一種區域特征描述子
影像金字塔是一種以多解析度來解釋影像的結構,通過對原始影像進行多尺度像素采樣的方式,生成N個不同解析度的影像。把具有最高級別解析度的影像放在底部,以金字塔形狀排列,往上是一系列像素(尺寸)逐漸降低的影像,一直到金字塔的頂部只包含一個像素點的影像,這就構成了傳統意義上的影像金字塔。影像金字塔更多的是一種構建不同尺度空間的思想,網路上搜索較多的可能是在SIFT演算法中的應用了,除此之外,還可以應用在光流中,slam的姿態估計中,還有加速模板匹配等等
hog特征是方向梯度直方圖(Histogram of Oriented Gradient, HOG)特征是一種在計算機視覺和影像處理中用來進行物體檢測的特征描述子。它通過計算和統計影像區域區域的梯度方向直方圖來構成特征首先,由于HOG是在影像的區域方格單元上操作,所以它對影像幾何的和光學的形變都能保持很好的不變性,這兩種形變只會出現在更大的空間領域上。其次,在粗的空域抽樣、精細的方向抽樣以及較強的區域光學歸一化等條件下,只要行人大體上能夠保持直立的姿勢,可以容許行人有一些細微的肢體動作,這些細微的動作可以被忽略而不影響檢測效果。因此HOG特征是特別適合于做影像中的人體檢測的。
行人檢測方面:由于HOG特征能夠反映人體的輪廓,并且它對影像中的人體的亮度和顏色變化不敏感,在其檢測方面有優良的性能。
車輛檢測方面:由于HOG特征對光照的不敏感、即使存在部分遮擋也可檢測出來,在各種復雜的交通路和停車場所,有很好的魯棒性。
跟蹤方面:HOG特征在跟蹤具有明顯邊沿輪廓的運動目標
3.當時硬體跟不上,能獲取的資料少。
4.影像分類就是看圖片中的物體具體是什么
目標檢測就是在給定圖片找到物體位置
語意分割就是識別圖象中存在的內容和位置
實體分割就是在像素級識別物件輪廓的任務
轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/99142.html
標籤:新技術前沿
