主頁 >  其他 > 134個預訓練模型、精度高達85.1%,百度視覺演算法最強基石PaddleClas全新升級

134個預訓練模型、精度高達85.1%,百度視覺演算法最強基石PaddleClas全新升級

2021-01-04 10:36:41 其他

來源:機器之心

本文約2700字,建議閱讀6分鐘

本文介紹了PaddleClas作為一個超強的影像分類任務的工具集,可以助力開發者訓練出更好的視覺模型并快速應用落地,

百度 PaddlePaddle 團隊開發的 PaddleClas 是一個適用于業界和學界的影像分類任務工具集,可以幫助用戶訓練更好的計算機視覺模型并應用于真實場景中,近期 PaddleClas 迎來了全面升級,其中提供了更高精度的知識蒸餾模型、更豐富的模型種類以及更佳的開發體驗,從而使得開發者更方便地在服務器端或者移動端、IoT 端進行部署,

影像分類任務作為深度學習視覺領域的基石,幾乎是每一位視覺方向開發者最先要學習的基礎本領,眾所周知,影像分類已廣泛應用在智慧零售、智慧交通、智慧醫療、智慧安防等等各行各業,不僅如此,影像目標檢測、影像分割、影像檢索、OCR、人臉識別等高階視覺任務也常將影像分類網路作為骨干網路,影像分類的網路結構和預訓練模型則無疑是智能視覺技術的穩固地基和強壯骨架,它的性能直接影響高階視覺任務的效果,

影像分類任務如此重要,但好的分類網路卻沒有那么容易被訓練出來,開發者往往要面臨像目標遮擋、尺度變化、變形、背景噪音過大、光照視角多變、目標姿態多變等問題,為了解決這些困難,大家一般需要從資料增廣、骨干網路設計、損失定義、優化器設計、模型壓縮裁剪量化、模型可解釋性、特征遷移學習等不同的角度對影像分類問題進行深入探索,聽起來是不是就頭大?

莫慌!PaddleClas 就是一個超強的影像分類任務的工具集,助力開發者訓練出更好的視覺模型并快速應用落地,PaddleClas 近期也完成了全新的升級,本次升級之后,PaddleClas 可算成為了地表超強開源影像分類別庫(不好說“最”,怕被請喝茶),那這個稱號是從哪里來的呢?讓我們用事實說話,看看 PaddleClas 升級后到底有多強大!

  • 更高精度的模型:基于百度自研的知識蒸餾方案(SSLD),PaddleClas 開源了 14 個 SSLD 分類預訓練模型,精度普遍提升 3% 以上;其中 ResNet50_vd 模型在 ImageNet-1k 資料集上的 Top-1 精度達到了 84.0%,Res2Net200_vd 預訓練模型 Top-1 精度高達 85.1%,同時也優化出更多業界 SOTA 模型,并支持影像檢測、分割以及 OCR 等高階視覺任務全面提升模型效果;

  • 更豐富的模型種類:本次升級新增 4 個系列模型(InceptionV3、GhostNet、ResNeSt 和 RegNet),至此 PaddleClas 總共包含 29 個系列的分類網路以及 134 個預訓練模型;

  • 開發體驗進一步升級:全面支持動態圖,使你的演算法構建、訓練以及評估除錯更輕松,并進一步打通全流程部署,無論是在移動端、IoT 端還是在服務器端進行部署,都可以在這里找到最佳的部署方案;

  • 數十種影像分類演算法開發的 Trick 和工具!深入理解開發者演算法開發程序中的難點,手把手教你提升演算法性能!

已經迫不及待要去看專案代碼了嘛?傳送門送你一程:

https://github.com/paddlepaddle/PaddleClas

覺得不錯的小伙伴可以點起 Star 支持一下~

在深入研究 PaddleClas 之后呢,本文也給大家決議一下 PaddleClas 本次升級的詳情,

更多高精度的知識蒸餾模型

PaddleClas 中提供了 SSLD 知識蒸餾方案,在無需更多有標簽影像的條件下,可以在不換模型的基礎上將分類模型的精度提升 3% 以上,在此次全面升級程序中,PaddleClas 進一步提供了基于 ResNet_vd、HRNet、Res2Net_vd、MobileNetV3、GhostNet 等骨干網路蒸餾得到的 SSLD 預訓練模型,不僅可以用于遷移訓練、預訓練權重引數;也可以用于檢測、分割等下游視覺任務中,進一步提升下游視覺任務的精度指標,

就讓我們看圖說話:下面兩張圖給出了 PaddleClas 在服務器端和端側(移動端、IoT 端)開源的 SSLD 蒸餾預訓練模型的精度提升對比情況:

可以看出,無論是服務器端還是移動端或 IoT 端,經過 SSLD 知識蒸餾之后的模型精度均提升了3% 左右,而且模型越大,精度提升越明顯,特別地,基于該蒸餾方案,PaddleClas 將 ResNet50_vd 的 Top-1 精度提升到 83.0%;進一步地,基于 Fix 策略,調大訓練尺度 (224 -> 320),ResNet50_vd 的 Top-1 精度可以到達 84.0%,

此外,基于 SSLD 蒸餾預訓練模型,在目標檢測任務中,模型精度提升也非常明顯,具體如下表所示:

在影像分割任務中, 基于 CityScapes 資料集的精度收益如下表所示:

在文字檢測任務中(OCR),基于 DBNet 的精度收益如下:

在絕大多數場景中,不需要任何額外的訓練或者預測成本,僅使用 SSLD 知識蒸餾預訓練模型,便可以輕松提升模型精度,更多 SSLD 的原理和性能,可以到這里查看詳情:

https://github.com/PaddlePaddle/PaddleClas/blob/release/2.0-rc1/docs/zh_CN/advanced_tutorials/distillation/distillation.md

更豐富的模型種類

如我們在開頭所述, PaddleClas 在此次升級中,進一步豐富了模型庫,新增 4 個系列模型(InceptionV3、GhostNet、ResNeSt、RegNet),目前總共包含 29 個系列的分類網路以及134 個預訓練模型,包括 ResNet、ResNet_vd、Res2Net、ResNeXt 、HRNet、ResNeSt、MobileNetV1/2/3、GhostNet 等,涵蓋了從服務器端到移動端的各類使用場景,這也是目前種類最豐富的影像分類代碼倉庫,

  • InceptionV3 是 Google 對 InceptionV2 的一種改進,首先,InceptionV3 設計和使用了更多種類的 Inception 模塊,部分 Inception 模塊將較大的方形二維卷積拆成兩個較小的非對稱卷積,從而大幅度節省引數量;

  • GhostNet 是華為于 2020 年提出的一種全新的輕量化網路結構,通過引入 Ghost module,大大緩解了傳統深度網路中特征的冗余計算問題,使得網路的引數量和計算量大大降低;

  • ResNeSt 系列模型是 2020 年提出的,在原有的 ResNet 網路結構上做了改進,通過引入 K 個 Group 和在不同 Group 中加入類似于 SEBlock 的 attention 模塊,使得精度相比于基礎模型 ResNet 有了大幅度的提升,且引數量和 flops 與基礎的 ResNet 基本保持一致;

  • RegNet 是由 Facebook 于 2020 年提出,通過加入共享瓶頸 ratio、共享組寬度、調整網路深度與寬度等策略,最終實作簡化設計空間結構、提高設計空間的可解釋性、改善設計空間的質量,并保持設計空間的模型多樣性的目的,

下面也分別給出了服務端模型和端側模型在 T4 GPU 和驍龍 855 芯片上的預測耗時與精度曲線,大家可以根據自己的預測耗時或者精度要求,選擇合適的分類網路,

更好的易用性

全面支持動態圖

靜態計算指的是程式在編譯執行時首先生成神經網路結構,然后再執行相應操作,通過這種先定義后運行的方式,再次運行的時候就不再需要重新構建計算圖,因此在速度方面會更快一些,動態計算指的是程式按照撰寫命令的順序進行執行,這會大大降低除錯的難度,在此次升級中,PaddleClas 在訓練程序中為動態圖模式,在預測部署時為靜態圖模式,從而保證了訓練程序中的易用性以及模型預測程序中的效率,

多系統、多硬體、多端部署全面支持

PaddleClas 現在支持包括 GPU/CPU/XPU、Windows/Linux/MacOS 等多種訓練平臺,對于訓練得到的模型,PaddleClas 提供基于服務器端(Paddle Inference)和 移動端、IoT 端(Paddle Lite),以及輕量化服務端(Hub Serving)的高性能部署方法,同時支持 Python 預測與 C++ 預測,滿足大多數開發者的使用需求,

更豐富的教程檔案及調優Trick

  • 《PaddleClas 的影像分類訓練、評估、預測開始教程》:https://github.com/PaddlePaddle/PaddleClas/blob/dygraph/docs/zh_CN/tutorials/getting_started.md

  • 開源社區小伙伴總結的《基于 PaddleClas 完成產業級影像分類專案》

  • 基于 Paddle Lite 在手機、機器人終端等進行模型優化與交叉編譯的方案《PaddleClas 端側部署教程》:https://github.com/PaddlePaddle/PaddleClas/blob/dygraph/deploy/lite/readme.md

  • 針對開發者在開發程序中遇到的實際難題總結出的《影像分類 30 問》https://github.com/PaddlePaddle/PaddleClas/blob/dygraph/docs/zh_CN/faq.md

  • 還有《PaddleClas 每周 FAQ》https://github.com/PaddlePaddle/PaddleClas/blob/dygraph/docs/zh_CN/faq_series.md 等等高價值內容

此外,考慮到影像分類領域內容豐富,更新頻繁,PaddleClas 官方團隊計劃盡可能高頻地持續更新影像分類領域的 Tricks、FAQ 等內容給到大家,力爭全方位讓開發者無論是進行學術科研以還是產業演算法應用程序中都更加順暢,

這樣有如和璧隋珠一樣的開源專案,這樣用心勤奮的技術團隊,你還不心動要嘗試使用下 PaddleClas 嗎?趕緊前往 PaddleClas 開源地址查看專案詳情吧!也歡迎各位小伙伴點星(Star)、Fork、Watch,方便反復研究查看~~

  • GitHub: https://github.com/PaddlePaddle/PaddleClas

  • Gitee: https://gitee.com/paddlepaddle/PaddleClas

如果您想詳細了解更多飛槳的相關內容,請參閱以下檔案,

官網地址:

https://www.paddlepaddle.org.cn

飛槳開源框架專案地址:

GitHub: https://github.com/PaddlePaddle/Paddle

Gitee: https://gitee.com/paddlepaddle/Paddle

編輯:王菁

校對:林亦霖

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/244227.html

標籤:AI

上一篇:蘋果M1芯片機器學習向測評:Mini 比RTX 2080Ti 快14%,Air好于Pro

下一篇:如何用一句話證明你是程式員?41 個答案揭曉!

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 網閘典型架構簡述

    網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......

    uj5u.com 2020-09-10 02:00:44 more
  • 如何從xshell上傳檔案到centos linux虛擬機里

    如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......

    uj5u.com 2020-09-10 02:00:47 more
  • 一、SQLMAP入門

    一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......

    uj5u.com 2020-09-10 02:00:50 more
  • Metasploit 簡單使用教程

    metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......

    uj5u.com 2020-09-10 02:00:53 more
  • 游戲逆向之驅動層與用戶層通訊

    驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......

    uj5u.com 2020-09-10 02:00:56 more
  • 北斗電力時鐘(北斗授時服務器)讓網路資料更精準

    北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......

    uj5u.com 2020-09-10 02:01:03 more
  • 【CTF】CTFHub 技能樹 彩蛋 writeup

    ?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......

    uj5u.com 2020-09-10 02:04:05 more
  • 02windows基礎操作

    我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......

    uj5u.com 2020-09-10 02:04:18 more
  • 03.Linux基礎操作

    我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......

    uj5u.com 2020-09-10 02:04:30 more
  • 05HTML

    01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......

    uj5u.com 2020-09-10 02:04:36 more
最新发布
  • 2023年最新微信小程式抓包教程

    01 開門見山 隔一個月發一篇文章,不過分。 首先回顧一下《微信系結手機號資料庫被脫庫事件》,我也是第一時間得知了這個訊息,然后跟蹤了整件事情的經過。下面是這起事件的相關截圖以及近日流出的一萬條資料樣本: 個人認為這件事也沒什么,還不如關注一下之前45億快遞資料查詢渠道疑似在近日復活的訊息。 訊息是 ......

    uj5u.com 2023-04-20 08:48:24 more
  • web3 產品介紹:metamask 錢包 使用最多的瀏覽器插件錢包

    Metamask錢包是一種基于區塊鏈技術的數字貨幣錢包,它允許用戶在安全、便捷的環境下管理自己的加密資產。Metamask錢包是以太坊生態系統中最流行的錢包之一,它具有易于使用、安全性高和功能強大等優點。 本文將詳細介紹Metamask錢包的功能和使用方法。 一、 Metamask錢包的功能 數字資 ......

    uj5u.com 2023-04-20 08:47:46 more
  • vulnhub_Earth

    前言 靶機地址->>>vulnhub_Earth 攻擊機ip:192.168.20.121 靶機ip:192.168.20.122 參考文章 https://www.cnblogs.com/Jing-X/archive/2022/04/03/16097695.html https://www.cnb ......

    uj5u.com 2023-04-20 07:46:20 more
  • 從4k到42k,軟體測驗工程師的漲薪史,給我看哭了

    清明節一過,盲猜大家已經無心上班,在數著日子準備過五一,但一想到銀行卡里的余額……瞬間心情就不美麗了。最近,2023年高校畢業生就業調查顯示,本科畢業月平均起薪為5825元。調查一出,便有很多同學表示自己又被平均了。看著這一資料,不免讓人想到前不久中國青年報的一項調查:近六成大學生認為畢業10年內會 ......

    uj5u.com 2023-04-20 07:44:00 more
  • 最新版本 Stable Diffusion 開源 AI 繪畫工具之中文自動提詞篇

    🎈 標簽生成器 由于輸入正向提示詞 prompt 和反向提示詞 negative prompt 都是使用英文,所以對學習母語的我們非常不友好 使用網址:https://tinygeeker.github.io/p/ai-prompt-generator 這個網址是為了讓大家在使用 AI 繪畫的時候 ......

    uj5u.com 2023-04-20 07:43:36 more
  • 漫談前端自動化測驗演進之路及測驗工具分析

    隨著前端技術的不斷發展和應用程式的日益復雜,前端自動化測驗也在不斷演進。隨著 Web 應用程式變得越來越復雜,自動化測驗的需求也越來越高。如今,自動化測驗已經成為 Web 應用程式開發程序中不可或缺的一部分,它們可以幫助開發人員更快地發現和修復錯誤,提高應用程式的性能和可靠性。 ......

    uj5u.com 2023-04-20 07:43:16 more
  • CANN開發實踐:4個DVPP記憶體問題的典型案例解讀

    摘要:由于DVPP媒體資料處理功能對存放輸入、輸出資料的記憶體有更高的要求(例如,記憶體首地址128位元組對齊),因此需呼叫專用的記憶體申請介面,那么本期就分享幾個關于DVPP記憶體問題的典型案例,并給出原因分析及解決方法。 本文分享自華為云社區《FAQ_DVPP記憶體問題案例》,作者:昇騰CANN。 DVPP ......

    uj5u.com 2023-04-20 07:43:03 more
  • msf學習

    msf學習 以kali自帶的msf為例 一、msf核心模塊與功能 msf模塊都放在/usr/share/metasploit-framework/modules目錄下 1、auxiliary 輔助模塊,輔助滲透(埠掃描、登錄密碼爆破、漏洞驗證等) 2、encoders 編碼器模塊,主要包含各種編碼 ......

    uj5u.com 2023-04-20 07:42:59 more
  • Halcon軟體安裝與界面簡介

    1. 下載Halcon17版本到到本地 2. 雙擊安裝包后 3. 步驟如下 1.2 Halcon軟體安裝 界面分為四大塊 1. Halcon的五個助手 1) 影像采集助手:與相機連接,設定相機引數,采集影像 2) 標定助手:九點標定或是其它的標定,生成標定檔案及內參外參,可以將像素單位轉換為長度單位 ......

    uj5u.com 2023-04-20 07:42:17 more
  • 在MacOS下使用Unity3D開發游戲

    第一次發博客,先發一下我的游戲開發環境吧。 去年2月份買了一臺MacBookPro2021 M1pro(以下簡稱mbp),這一年來一直在用mbp開發游戲。我大致分享一下我的開發工具以及使用體驗。 1、Unity 官網鏈接: https://unity.cn/releases 我一般使用的Apple ......

    uj5u.com 2023-04-20 07:40:19 more