【點云處理】基于深度學習模型的不同處理方式-有解無憂

前言

點云資料由無序的資料點構成的一個集合；點與點之間是具有空間關系的；點云資料所代表的目標對某些空間轉換應該具有不變性，如旋轉和平移，

點云資料處理方式，通常有：將點云資料投影到二維平面（多視圖法）、將點云資料劃分到有空間依賴關系的voxel（體素法）、直接在點云資料上應用深度學習模型（點云法），

一、點云資料特點

1.1 無序

1.2 點與點之間的空間關系

1.3 不變性

二、點云資料處理方式

2.1 將點云資料投影到二維平面（多視圖法）

2.2 將點云資料劃分到有空間依賴關系的voxel（體素法）

2.3 直接在點云資料上應用深度學習模型（點云法）

一、點云資料特點

點云資料是在歐式空間下的點的一個子集，它具有以下三個特征：無序、點與點之間的空間關系、空間轉換不變性，

1.1 無序

點云資料是一個集合，對資料的順序是不敏感的，這使得處理點云資料的模型需要對資料的不同排列保持不變性，

為什么說點云資料是無序的？？先看下圖：

左邊有三個點云，右邊也有三個點云，雖然每個點的索引值不一樣，但是它們的分布、形狀等都是一樣的；在分類或分割模型，對左、右兩幅圖應該輸出同一個結果（看起像三角形），

再看看左邊和右邊的點云索引值不是對應的，

所以說：點云資料由無序的資料點構成一個集合來表示；分類或分割模型，不應該受點云資料集的順序影響，

1.2 點與點之間的空間關系

一個物體通常由特定空間內的一定數量的點云構成，也就是說這些點云之間存在空間關系，

查看源影像

1.3 不變性

點云資料所代表的目標對某些空間轉換應該具有不變性，如旋轉和平移，如下圖所示，同一個物體，在空間經過旋轉或平移，還是原來那個物體，

二、點云資料處理方式

2.1 將點云資料投影到二維平面（多視圖法）

此種方式不直接處理三維的點云資料，而是先將點云投影到某些特定視角再處理，如前視視角和俯視角，再使用2D-CNN進行分類或分割，

同時，也可以融合使用來自相機的影像資訊，通過將這些不同視角的資料相結合，來實作點云資料的認知任務，比較典型的演算法有MV3D和AVOD，

MV3D-Net 融合了視覺影像和激光雷達點云資訊；輸入資料有三種，分別是點云俯視圖、點云前視圖和RGB影像，通過特征提取、特征整合和特征融合，最終得到類別標簽、3D邊界框，這樣的設計既能減少計算量，又保留了主要的特征資訊，

AVOD-Net算是MV3D-Net的加強版，它也融合了視覺影像和激光雷達點云資訊，但它去掉了激光點云的前視圖輸入、去掉了俯視圖中的強度資訊；輸入資料有二種，分別是點云俯視圖和RGB影像，AVOD-Net使用FPN來提取特征，同時添加邊界框的幾何約束，整體模型效果有提升，

詳細可看看這兩篇博客：

【論文解讀】MV3D-Net 用于自動駕駛的多視圖3D目標檢測網路

【論文解讀】AVOD-Net 用于自動駕駛的聚合視圖3D物件檢測網路

2.2 將點云資料劃分到有空間依賴關系的voxel（體素法）

基于3D-CNN的體素模型：先將點云映射到體素空間上，再通過3D-CNN進行分類或者分割，

體素化網格是將 3D 物件擬合到網格中的最直觀的方法，為了使其看起來像是像素影像，我們在這里將其稱為體素voxel，在這種情況下，3D 影像由（x，y，z）坐標描述，它看起來就會像樂高一樣，

此種方式通過分割三維空間，引入空間依賴關系到點云資料中，再使用3D卷積等方式來進行處理，經典的網路有：VoxNet，

缺點1：計算量受限制，目前最好的設備也大致只能處理32×32×32的體素；另外由于體素網格的立方體性質，點云表面很多特征都沒有辦法被表述出來，因此模型效果差，

缺點2：由于是三維的資料量，時間和空間復雜度都非常高，目前已經不是主流的方法了，

2.3 直接在點云資料上應用深度學習模型（點云法）

直接使用點云資料，比較經典的有PointNet、PointNet++，

F-PointNet 也是直接處理點云資料的方案，但它在進行點云處理之前，先使用影像資訊得到一些先驗搜索范圍，這樣既能提高效率，又能增加準確率，

F-PointNet的思路是：

基于影像2D目標檢測，
基于影像生成錐體區域，
在錐體內，使用 PointNet/PointNet++ 網路進行點云實體分割，

詳細可看看這篇博客：【論文解讀】F-PointNet 使用RGB影像和Depth點云深度資料的3D目標檢測

特點：直接將三維點云拋入網路進行訓練，資料量小，主要任務有分類、分割以及大場景下語意分割，

參考：https://zhuanlan.zhihu.com/p/44809266

https://club.leiphone.com/page/TextTranslation/737

【論文解讀】MV3D-Net 用于自動駕駛的多視圖3D目標檢測網路

【論文解讀】AVOD-Net 用于自動駕駛的聚合視圖3D物件檢測網路

【論文解讀】F-PointNet 使用RGB影像和Depth點云深度資料的3D目標檢測

轉載請註明出處，本文鏈接：https://www.uj5u.com/qita/290571.html

標籤：AI

上一篇：【OpenCV】??高手勿入! 半小時學會基本操作 14?? 影像輪廓

下一篇：vulhub-httpd-cve-2017-15715