? ? 隨著資料的暴增和計算機硬體技術的發展,也催生了AI技術在各行各業的應用滲透,而想將AI技術應用到各行各業,資料是必需品,因為資料直接影響到AI最終訓練出來的模型好壞,AI建模沒有太大門檻,但資料才是真正的門檻,因此,目前業界流傳著一段話有多少人工智能,就有多少人工,前一篇講述了資料如何標注及其注意,今天來學習一下資料標注的型別有哪些?
誰來做資料標注
? ? 目前各個公司需要標注的資料,一般同下面幾大公司或人員承擔
- 公司自己招聘人員或實習生進行標注
這種方式最大的優勢是:可以隨時檢查標注的質量和進度,便于快速溝通和調整,資料可以做到保密不外泄;劣勢是成本較高
- 外包給資料標注公司
這種方式最大的優勢是:速度非常快,成本低廉,標注公司也具備一定的開發標注工具能力,可定制性化能力較強;但劣勢也明顯標注公司魚龍混雜,參差不齊,需要隨時檢查標注質量,返工成本較大,另外資料也無法做到保密不外泄
- 外包給私人團體
這種方式的優劣勢基本同標注公司,優勢是成本較低,因為可以大量招收人員,如農村閑置人員,兼職人員等,稍微培訓下即可投入標注,
誰來管理資料標注
? ? 針對資料分配給不同的人員,相應的角色也可以分為三種型別:
- 資料標注人員
主要負責資料的標注和匯總
- 資料檢查人員
主要負責資料標注的質量檢查,常采用抽檢方式檢查,可細分為部分抽檢(比例約20%~30%)或全部抽檢
- 資料管理人員
負責人員任務分配、進度跟進、標注培訓及對外/對內協調溝通等
資料標注型別
? ? 因AI技術應用到具體的實體場景,會有很大差異,因此標注的型別也有很多,詳細如下所示:
影像標注-2D邊框標注
? ? 這種型別應該是最常見的標注方式,常用于檢測目標物件的相應區域,標注框位于目標物件的四周,如下圖所示:

影像標注-3D邊框標注
? ? 也稱立方體標注,相比2D標注而言,還可以展現目標物件的近似深度,如下所示:

影像標注-語意分割
? ? 根據檢測區域的不同,將影像標注為不同的像素,如下所示:

影像標注-多邊形標注
? ? 根據需求標注目標物件的形狀,常用于無法使用邊框標注的不規則的目標物件,需要在目標物件的各個關鍵點進行描點,無論最終為何形狀,均要能反應目標物件的輪廓形狀和所有邊緣,如下所示:

影像標注-直線或曲線標注
? ? 根據需求標注目標物件對應的線條位置,線條可能是直線也可能是曲線,常用于分隔表明邊界的事物,常用于自動駕駛,如下所示:

影像標注-點標注
? ? 這種標注一般用于人臉識別,人體姿態跟蹤(如POSE演算法)等

視頻標注-跟蹤標注
? ? 在視頻或連續的影像中跟蹤標注的目標物件,形成與ID關聯的運動軌跡
文本標注-中英文語音轉寫與校對
? ? 英文語音轉中文文本或中文文本轉英文語音,
語音標注-客服語音標注
? ? 外呼機器人進行外呼記錄語音標注呼叫成功或失敗,從而訓練話術,
常用標注工具
? ? 常用標注工具如下所示:
- labelImg
下載地址:https://github.com/tzutalin/labelImg
注意事項:使用labelImg時,路徑不能包含中文
- 精靈標注助手
下載地址:http://www.jinglingbiaozhu.com/
本文同步在微信訂閱號上發布,如各位小伙伴們喜歡我的文章,也可以關注我的微信訂閱號:woaitest,或掃描下面的二維碼添加關注:

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/63776.html
標籤:其他
