摘要
簡單的分享一下我自己的學習路線,可以參考未必適合所有人,我個人更傾向于用知識去參加競賽博取獎金,那么該如何入門在到成長為競賽達人,
掌味訓礎語言python
我從python到全部學習能夠輕松參加各類競賽差不多需要一年的時間磨練,在此之前有較好的掌握c,c++,能用代碼輕松表達自己想要的目的,用自己的邏輯方式去寫代碼還是一件比較有意思的事情,學習python也是比較簡單,一周的時間差不多就能掌味訓礎語法,學習python語言是很容易,最重要的是邏輯思維能力,是初學代碼需要長時間的代碼磨礪去鍛煉的,基礎學習可以去bilibili參考莫煩python,
掌握python基礎語言就可以去學習《利用python進行資料分析》這本書、最重要的是三大庫的學習,numpy,pandas,matplotlib庫的使用,記住numpy中的各種資料轉化,這個很有用,可以做到將numpy中任何的資料提取出來轉化成任何的輸出格式(比賽提交格式),將我推薦的這本書仔細從頭到尾敲一遍就差不多了,等需要的時候在專門記憶各種函式功能,
機器學習基礎
入門cv的話其實不需要全部學完,本科階段想以最快的方式去參加競賽可以跳過很多學習內容,重點是掌握線性回歸,邏輯回歸,神經網路這三章,學會公式推導,python寫出來也是需要幾周的時間,參考書籍周志華的西瓜書和《機器學習實戰》,同時要參考bilibili上機器學習-白板推導系列,用python代碼敲打練習的時候一定要每一行輸出看看,感受資料經過每一行代碼中的變化,尤其是神經網路,這個雖是入門深度學習的基礎,但很重要,我自己對深度學習的認知和感觸就是通過不斷的python練習去感受,通過這部分所得知識就能后在后期的比賽中能夠隱約的去感受猜測大概什么樣的網路時候這場比賽,什么樣的資料增強應該能漲分或者降分,可以減少去嘗試的次數,
深度學習
到這一步你就可以學習對影像的處理了,基礎知識當然是opencv的學習,使用python對影像各種操作,這一步一定要理解python讀取影像的各種形式,學習這個目的就是為了在使用深度學習進行資料訓練前的準備和自己寫資料增強部分,bilibili上同樣有很豐富的資源去學習,學習完成之后就可以去學習一門框架來進行深度學習了,pytorch是國內外競賽主流框架,國內目標檢測類比賽基本全是,目前我所參加看到的比賽都是pytorch框架,其次才是tensorflow,二者我都學習過,還是pytorch去書寫代碼十分方便,學習pytorch框架(百度網盤學習資料)
https://pan.baidu.com/s/1G-szdYfBCKYd0SbmCJwN0w
(密碼1234),這是我個人學習的視頻資料,用來入門還是十分可以的,或者如果你精力比較足的話直接看pytorch官網公布的各種函式功能,花一個月的時間去學習,
基礎實踐
學會用pytorch去訓練官方配置好的資料集比如minst資料集,這是第一步,很多的csdn上也有很多代碼可供參考,視頻課中也有講解,這一步是體會使用深度學習進行訓練的程序,大部分電腦還始都可以帶動的,不過最好建議有一臺屬于自己的linux電腦,gpu差不多1080ti(低一點也沒關系,主要是用來跑通除錯代碼,不作為主要訓練的機器,但是太低的話電腦壓根無法運行 程式)主要是學習linux環境下配置各種環境,自己一定要獨立完成(比賽都會以各種方式進行提交成績linux必會,不然提交成績你都不行),
cv方向
國內競賽基本還是目標檢測比較多,其次語意分割也慢慢的開始逐漸多了起來,學習順序應該是目標分類,目標檢測,語意分割(語意分割我是直接跳過的,這里其實應該先學習語意分割的,難度小于目標檢測),根據個人情況吧,想最快的接觸比賽就是學習分類,檢測,語意先不學,那么分類應該學到什么程度那,第一,你要能夠訓練任何資料集,使用官方下載的minst訓練十分方便,但現實比賽給你的資料都是各種方式,需要你自己去處理的,可以參考我博客中
資料處理分類
分類
學會加載任何資料集,方便訓練,第二點就是學習各種分類網路,分類網路算是十分好敲的代碼部分,代碼難度書寫也比較容易,可以學習各種主流網路去學習,推薦模式看論文,讀原始碼,去github上去找,論文的話最好開著vpn去google直接搜名字就行,敲上10個分類網路模型就差不多,能夠體會到各種網路的差異性,這一步是為自己創新做準備,大部分分類比賽也都是直接用開源的模型直接訓練,只有極少數比賽使用自己創造的模型在kaggle上奪冠,掌味訓礎的訓練就可以去研習社去下載和參加分類的比賽,代碼別人也都會有分享,
檢測
目標檢測學習就相對困難很多,分為單階段檢測器和雙階段檢測器,其中雙階段檢測器自己去學習原始碼的話還是十分困難的,中間有一部分代碼大都會用的c++寫roipool操作,需要掌握c++和cuda的一些書寫代碼,所以直接入手單階段檢測器最方面,可以完全有能力復現出來,只有讀懂一個才能會更好的運用,目標檢測的代碼量也比較龐大,新手剛學習可能需要幾周的時間去讀懂原始碼,學習如何龐大的原始碼就從資料加載,模型構建,訓練,測驗,評測map,分開學習,代碼也是可以單獨構建出來,學習的具體程序我個人更傾向于輸出代碼執行的每一行,去了解資料在代碼中的運轉和變化,掌握代碼之后便要開始訓練比賽資料集了,這里推薦使用vpn去google colab去訓練,gpu會員是v100,一個月76元,很劃算,訓練模型的話可以參考我博客中yolo系列訓練和最重要的mmdet使用(國內競賽必備)github搜索mmdetection,專門為競賽而生的目標檢測框架,在colab使用也是十分方便,上傳資料集速度取決于你的vpn,去kaggle,天池,以往的各類目標檢測競賽去學習冠軍的代碼和思路,這里就需要自己摸索,比賽新人的話最好在比賽中找人去組隊,大佬一般招新人的要求只有二種,第一,你有很好的設備,用你的設備去訓練,第二,同樣精通linux各種環境配置掌握,這里主要是mmdet使用,可能需要你(docker中配置mmdet,或者其他),知道推理安裝mmdet和自己訓練安裝mmdet是二種程序,有這些知識和設備基礎你才配當勞動力,
檢測學習技巧
我個人的博客有詳細的講解retinanet這個單階段目標檢測器,也是最容易復現的,可以直接去github多找幾個版本去學習練習,一定要從頭到尾的搞懂,這是理解目標檢測的關鍵,對網路只會盲目的使用沒有任何意義,一個學習cv的本科生博主可以去了解別人對代碼的掌握程度,基本所有代碼自己都敲過一遍,為以后創新模型發頂會打下基礎,總之,學習目標檢測就是硬著頭皮閱讀原始碼,一步一步的學習,熟練之后就可以很容易的去訓練github開源的任何目標檢測框架用于比賽之中,整體學習流程也可以參考我博客的學習順序,
總結
目標檢測競賽說難也不是很難,多學kaggle關注你所要參加比賽的型別,在kaggle你能學到更多的操作和世界會議舉辦的各種競賽,學習冠軍的原始碼能受益匪淺,運用到國內的競賽也是很容易拿到top的名額,多去關注比賽發布的資訊,比如微信群cver交流群,會經常推送一些比賽和最新的論文和好的文章供大家學習,最主要剛入手比賽一定要把第一的隊伍加好友,可以問一些問題能夠學到很多東西,大部分也愿意教,國內原始碼共享的話可能比較難,大部分不愿意共享自己的代碼,只能自己去厚著臉去要和收集,以上也只是我個人的學習程序和感悟,本科生盡可能的參加競賽,這樣研究生就可以有三年的時間同時參加競賽,我認識的比較厲害選手參加競賽和實習能夠在研究生期間拿到幾十個w,所以往后競賽應該會越來越多,不斷的去積累知識,總會有比賽能夠獲獎的,
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/158967.html
標籤:python
下一篇:MongoDB設計方法及技巧
