讀了很多論文,咱們自己心里也對整體的進展有了一些了解和脈絡,那么下一步就可以試著復現啦~
而要復現人家的代碼,那肯定得找人家的資料集,資料到手后就可以開始處理了~ 這篇主要粘一些看到的比較好的博客
平臺
我自己就是覺得pytorch比tensorflow帥hhhh,而且很多師兄大佬也說pytorch比較好,那就可以先從官網教程開始了解~
- 需要指明一點,大家安裝pytorch后其實不需要裝cuda也可以用gpu(因為torch里附帶了一些cuda的驅動),但是好像是功能受限,如果想要完整版應該還是得老老實實cuda+cudnn
資料處理
要訓練模型的話,最好是喂一批(batch)一批的資料進去,所以我們需要把資料讀取自己需要的部分,然后讓資料成批呈現,這里pytorch提供了很方便的工具Dataset和DataLoader,定義好了就可以直接用;
我想著重說一下torchtext啊,主要是在文本處理這塊用,其中有很豐富方便的功能,其實pytorch官網中一些text的教程中都用到了這個工具,但是沒有給出一個系統化的用法,所以我google了一下發現這篇講的很清楚,還有一篇但是這個界面太丑了,我沒細看,
另外
我參(zhào)考(chāo)微軟開源推薦系統 提供的代碼,將資料處理的部分遷移(其實就是照搬,,,改動了一點部分,加了一些注釋,洗掉了一些小專案不必要的抽象)到pytorch平臺下,詳情參考 我的倉庫,
我自己也還在探索中,會一直更新,希望廣泛交流,
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/200719.html
標籤:python
下一篇:TAGNN代碼解讀
