NTU-RGB+D資料集
論文連接:NTU-RGB+D
一、基本介紹
該資料集包含60個種類的動作(見表1),共56880個樣本,其中有40類為日常行為動作,9類為與健康相關的動作,11類為雙人相互動作,這些動作由40個年齡從10歲到35歲的人完成,該資料集由微軟 Kinect v2傳感器采集得到,并且使用了三個不同角度的攝像機,采集的資料形式包括深度資訊、3D骨骼資訊、RGB幀以及紅外序列,

二、兩個評價準則
NTU資料集在劃分訓練集和測驗集時采用了兩種不同的劃分標準,
1、Cross-Subject
Cross-Subject按照人物ID來劃分訓練集和測驗集,訓練集40320個樣本,測驗集16560個樣本,其中將人物ID為 1, 2, 4, 5, 8, 9, 13, 14, 15,16, 17, 18, 19, 25, 27, 28, 31, 34, 35, 38的20人作為訓練集,剩余的作為測驗集,
2、 Cross-View
按相機來劃分訓練集和測驗集,相機1采集的樣本作為測驗集,相機2和3作為訓練集,樣本數分別為18960和37920,
說到相機就不得不說相機的設定規則,三個相機,相機的垂直高度都是一樣的,水平角度分別為-45°、0°和45°,每個動作執行人做兩遍相同的動作,一個次對著左邊的相機,一次對著右邊的相機,也就是說最后會采集到2×3個不同角度的資訊,最后,設定不同的相機高度及距離以增加視角多樣性,并賦予一個設定號(1-17),見表2,

三、NTU的骨架坐標資料集
由于筆者的研究方向是基于骨架的動作識別,所以主要和讀者分享NTU中骨架資料集的相關內容,其他形式的資料集讀者可進入NTU-RGB+D論文中了解更多的內容,
NTU采集到的骨架點共25個,如下圖所示,

1、檔案命名方式
首先,資料集中有56880個.skeleton檔案,每個檔案代表一個樣本,檔案命名方式如下圖所示,

S后面跟的是設定號(1-17),正如表2所示
C后面跟的是相機ID(1-3)
P后面跟的是人物ID(1-40)
R后面跟的是動作執行的遍數(1-2)
A后面跟的是動作的分類(1-60)
2、資料的格式
可以用excel打開檔案,里面的內容如下所示,

第1行為該樣本的幀數
第2行為執行動作的人數
第3行共有10個資料分別代表'bodyID', 'clipedEdges', 'handLeftConfidence','handLeftState', 'handRightConfidence', 'handRightState','isResticted', 'leanX', 'leanY', 'trackingState'
第4行代表關節點數
第5-29行為25個關節點的資訊,每個關節點有12個資料,分別代表'x', 'y', 'z', 'depthX', 'depthY', 'colorX', 'colorY','orientationW', 'orientationX', 'orientationY','orientationZ', 'trackingState'
以上為一幀的資訊,其他幀都是上述表示方式,
NTU坐標形式的資料集在此下載,提取碼oeef,
轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/241381.html
標籤:其他
上一篇:java中浮點數表示方式
下一篇:12.21-12.27
