在入門NLP之前,博主也是一頭霧水,資料集不知道從哪里來,模型沒法訓練,故而對于模型及演算法的細節得不到實作,更看不到模型運行后的效果,所以博主簡單總結以下幾點,當缺少資料集時該怎么辦?
1.如果你的方向是CV,那么一般是對現有的資料做資料增強,圖片做各種旋轉、斜切、曝光等;不過最好的方式還是通過使用膠囊網路來進行學習,通過學習到各種角度問題來解決資料不足的問題;
2.如果你的方向是NLP,通過爬蟲去收集一些商品或店鋪的評價及分數,常用的爬蟲有bs4,scrapy等常用框架,如有學習的需要,私聊我(超詳細的資料哦);
3.互聯網知名比賽所用資料集或其他公開的資料集,比如天池等,博主已經收集CV、NLP等一些常用的任務的資料集,如有需要,私聊我哦);
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/21258.html
標籤:其他
上一篇:分析常用名詞含義 指標 維度
下一篇:筆試題之圖形題和數列題
