博客:https://wenjie.blog.csdn.net/
作者:走在前方
介紹:計算機碩士,多年作業經驗,技術和產品負責人, 多年推薦系統/NLP/大資料作業經驗, 負責公司多個AI專案產品落地,包括文本分類、關鍵詞抽取、命名物體識別、對話系統中語意理解、FAQ智能問答、知識圖譜、圖搜、推薦系統等
本文主要分享核心要點
- 圖片標簽問題
- 什么是多標簽影像分類
- 多標簽影像分類與多類影像分類有何不同
- 構建多標簽影像分類模型的步驟
- 你了解哪些多標簽影像分類模型結構
- 多分類和多標簽分類器和損失函式選擇
- 圖片標簽在推薦和搜索系統應用
- 不同圖片業務應用
- 二分類
- 多分類
- 多目標任務
- 多標簽
- 以圖搜圖
- 多目標輸出圖片分類應用
- 背景和資料介紹
- 自定義資料集合網路模型設計
- 模型加載預測
- 在線預測以及資料可視化
- 多標簽圖片分類應用
- 多標簽和多分類區別
- 二分類和多分類以及損失函式
- 網路模型設計
- 多標簽預測
- 以圖搜圖應用
- 圖搜應用場景和原理
- 開源向量檢索引擎
- 系統架構
- 圖片特征抽取和在線實時檢索
圖片標簽問題

- 什么是多標簽影像分類
- 多標簽影像分類與多類影像分類有何不同
- 構建多標簽影像分類模型的步驟
- 你了解哪些多標簽影像分類模型結構
- 多分類和多標簽分類器和損失函式選擇
- 圖片標簽在推薦和搜索系統應用
不同圖片標簽差異


圖片分類:二分類(binary-class classification)場景

圖片分類:多分類(Multi-class classification)場景

以4類(貓、狗、兔子和鸚鵡)看下多分類特點:
每張圖片只能被分類為貓、狗、鸚鵡或兔子,沒有任何一個影像屬于多個類別的情況
圖片分類:多輸出分類(Multi-output classification)場景
3類(電商時尚類):性別+顏色+型別( 每張圖片都有3個固定的標簽 ),固定輸出圖片多標簽

圖片分類:多標簽圖片分類(Multi-label classification)場景

多標簽圖片分類
①每個影像都屬于一個以上的類
②每個圖片出現的標簽并不是固定的
③標簽獲取從標簽池中選擇最可能標簽展示
以圖搜圖
- 基于圖片標簽搜索
- 基于圖片特征搜索

多目標輸出圖片分類
背景介紹
隨著電子商務產業快速發展,有大量的資料集等待著我們去搜集和研究,除了專業拍攝高質量產品影像,商品本身還擁有多個標簽屬性,用于描述商品各種特征,另外,還提供了關于商品特性的描述性文本
資料介紹:每個商品都有一個唯一編碼(例如:ID =15970) ,商品資訊主要欄位資訊如下所示

資料分析

自定義資料集**+**模型定義和設計
自定義資料集
①加載指定的標簽資料
②計算標簽種類和數量統計
③構建標簽字典
④自定義資料集工具類
模型定義和設計
①加載預訓練的網路(例如:mobilenet_v2,resnet,resnext. 用戶可以自己選擇進行實驗)
②修改基礎網路結構,原來網路最后一層僅支持一個分類標簽輸入
③每個標簽屬性損失函式選擇cross-entropy loss (采用聯合訓練求loss)
模型資料驗證混淆矩陣可視化

模型加載
model = MultiOutputModel(n_color_classes,
n_gender_classes,
n_article_classes)
model.to(device)
checkpoint = “./checkpoints/2020-09-21_15-59/checkpoint-000049.pth”
model.load_state_dict(torch.load(checkpoint,map_location=‘cpu’))
model.eval()
圖片多標簽預測

多分類輸出多標簽案例演示


多標簽圖片分類
多標簽和多分類應用
- 不同任務的圖片分類應用

- 針對一張圖片,強制只能一種數字,可以使用softmax分類器

- 胸部X光片:一次胸部X光片可以同時顯示多種不同的醫療狀況,如果我們為胸部x光片構建一個分類器,我們希望該分類器能夠指示存在多種情況,這是一張同時顯示肺炎和膿腫的胸部x光照片,以及相應的標簽,

- 入院:根據患者的健康記錄,我們可能需要預測該患者將來是否會入院,我們可以將其定義為一個分類問題:根據患者未來的入院診斷(如果有的話)對患者過去的健康記錄進行分類,患者可能因多種疾病入院,因此可能有多個正確答案

介紹兩個重要的分類器
Sigmoid和Softmax對比



資料介紹


分類器**+**損失函式


網路模型設計

多標簽分類模型**-**效果可視化


多標簽圖片分類功能演示



以圖搜圖
圖搜競品分析
以圖搜圖,在指定圖庫中搜索出相同或相似的圖片,適用于圖片精確查找、相似素材搜索、拍照搜同款商,
品、相似商品推薦等場景
例如:百度影像搜索-基于深度學習的以圖搜圖,我們來看看具體場景應用,
https://cloud.baidu.com/product/imagesearch
相似圖片搜索
在自建圖庫中找到與檢索圖片語意相似的圖片集,并給出相似度打分(綜合圖片型別、顏色、內容、布局等特征);適用于各種相似圖片查找、相關內容推薦場景

- 設計素材查找
基于拍攝照片查找相似或相同的圖片作品,滿足設計師人群、作業人員更快捷高效查找原版大圖或相似作品的需求
- 商品搜索及推薦
將用戶拍攝的圖片在商品庫中搜索,找到同款或相似的商品,進行商品銷售或者相關商品推薦,提升搜索查找的便捷性,優化用戶體驗
- 相關內容推薦
將文章內容或者產品服務中的圖片入庫,通過比對用戶上傳的圖片,查找相似圖片,從而找到相關的內容資訊,實作相關內容搜索、推薦
相同圖片搜索
在自建圖庫中找到與檢索圖相同的圖片,支持找到區域內容相同的大圖,或適度調整背景和角度的相同圖片;可用于圖片精確查找、重復圖片過濾等場景

應用場景
- 重復圖片過濾
搜索圖庫中是否有相同或高度相似的圖片,實作系統內圖片去重或過濾,避免重復內容引起的資源浪費、體驗下降等問題
- 圖片精確查找
在圖片庫中找到主體相同的圖片,結合相似度分值,判斷圖片內容是否嚴格相同,可用于特定圖片查找、圖片內容精準關聯等場景
商品圖片搜索
針對商品類圖片,專項訓練檢索模型,在自建圖庫中搜索相同及相似的商品圖片集,可找到不同顏色、背景、角度的同款商品;適用于電商平臺拍照搜商品等場景

- 商品搜索及推薦
將用戶拍攝的圖片在商品庫中搜索,找到同款或相似的商品,進行商品銷售或者相關商品推薦,提升商品搜索查找的便捷性,優化用戶購買體驗
- 商品識別
將商品名稱與圖片相匹配一起入庫,通過圖片相似度判斷實作指定集合內的商品識別,可用于戶外廣告拍照下單、供應鏈系統拍圖找貨等場景
接下來我們就針對圖搜場景進一步探索,
以圖搜圖介紹

以圖搜圖應用場景
現在大火的人工智能主要是:語音識別,自然語言處理,計算機視覺,推薦系統等等,
人工智能技術應用:
n語音識別+自然語言處理:amazon echo,google assistant/home,siri,國內一大票智能音箱
n計算機視覺:微博面孔專輯(商湯提供的cv能力),海康威視/格林深瞳的安防,**拍立淘(手機淘寶里面的相機入口),百度識圖(百度app里面的相機入口),**Google Photo
n推薦系統:手機淘寶主頁往下翻有個欄目叫猜你喜歡,qq/網易音樂的每日推薦歌曲等
圖片搜索的主要應用是二維碼掃描、以圖搜圖、拍照搜題、拍照翻譯、AR翻譯、以圖搜劇等


以圖搜圖基本原理

Faiss 開源向量檢索引擎
Faiss是Facebook AI團隊開源的針對聚類和相似性搜索庫,為稠密向量提供高效相似度搜索和聚類,支持十億級別向量的搜索,是目前最為成熟的近似近鄰搜索庫,它包含多種搜索任意大小向量集(備注:向量集大小由RAM記憶體決定)的演算法,以及用于演算法評估和引數調整的支持代碼,Faiss用C++撰寫,并提供與Numpy完美銜接的Python介面

Faiss不同類別索引

Faiss索引構建原始碼解讀

演示資料介紹(資料來源+索引構建)
資料集介紹
圖片集包含 17125 張圖片,涵蓋 20 個目錄,
n人類;
n動物(鳥、貓、牛、狗、馬、羊);
n交通工具(飛機、自行車、船、公共汽車、小轎車、摩托車、火車);
n室內(瓶子、椅子、餐桌、盆栽植物、沙發、電視)
資料集大小:~2GB
說明:您也可以使用其他的圖片資料進行圖片索引構建和檢索,
索引構建壓縮
嘗試20萬照片構建圖片索引生成439M索引檔案
索引降維壓縮后,最后生成32M索引檔案,效果基本不受影響
以圖搜圖系統架構

圖片特征抽取

在線實時檢索演示
- 第一張照片:用戶檢索照片,后面相似照片推薦(相似得分:從左到右、從上到下排序)
- 索引庫采樣降維壓縮,壓縮前后減少1/4
- 圖片檢索速度在毫秒級別

更多學習資料請參考
[1]深度學習之多目標輸出圖片分類
https://edu.csdn.net/course/detail/30928
[2]深度學習之多標簽圖片分類
https://edu.csdn.net/course/detail/30188
[3]圖搜競品分析
https://cloud.baidu.com/product/imagesearch
[4]圖片垃圾分類
https://edu.csdn.net/course/detail/26983
[5]圖片貓狗分類
https://edu.csdn.net/course/detail/25802
轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/171559.html
標籤:其他
上一篇:2020-10-12
下一篇:可惡的面試題
