1. 為什么要寫這個專欄

??大家好，我是herosunly，從985院校碩士畢業，現擔任演算法研究員一職，CSDN博客專家，2020年博客之星TOP，曾獲得阿里云天池比賽第一名等Top名次，擁有多項發明專利，對機器學習和深度學習擁有自己獨到的見解，曾經輔導過若干個非計算機專業的學生進入到演算法行業就業，
在這里插入圖片描述

??7月初寫了一篇保姆級人工智能學習成長路徑，得到了讀者的廣泛好評，但不少讀者覺得意猶未盡，希望能出更加詳盡的課程，比如如何能夠真正入門某一細分領域，如NLP(自然語言處理)，為了幫助熱愛學習的同學，在作業之余，特意撰寫NLP經典模型復現專欄，之所以寫此專欄，是因為在我心中最快入門某個機器學習領域的方法是read the paper, and reproduce the code(閱讀經典論文并復現其代碼)，

??很多人可能覺得很詫異，因為在大多數人看來學習視頻是入門的最好方式，而我卻并不贊同，因為學習視頻只能算是了解，而無法達到入門的效果，雖然教學的本質應當是傳道受業解惑，但在教學的程序中知識層面上受益更大的是老師，而并非學生(費曼學習法的本質，感興趣的同學可以深入了解該方法)，而入門的真正有效的方法唯有動手實踐，那么就讓我陪伴大家開啟這次NLP經典模型復現之旅吧，

??為了減輕上手學習的難度，在本次學習中采用的深度學習框架是Pytorch，主要原因在于該框架方便除錯，如果大家有強烈的需求，后續也會增加相應的Tensorflow版本，

2. 專欄的主要內容

??首先我會從NLP領域中最為基礎性的作業即詞向量，在第一部分中，要復現的經典詞向量模型包括NNLM、word2vec、FastText等，那么簡要說明一下它們之間的關系，在詞向量中最為經典的模型當屬word2vec，NNLM是word2vec的鼻祖，也是非常具有代表性的作業，然后在word2vec的基礎上又發展了FastText和Glove，

??第二部分會深入講解神經網路經典模型：卷積神經網路和回圈神經網路在文本中的應用，即TextCNN、TextRNN、TextLSTM、Bi-LSTM(雙向LSTM)，

??緊接著第三部分會講解Seq2Seq模型及其應用（如機器翻譯等任務），并引出Attention(注意力機制)是如何在原有模型基礎上進行改進的，

??第四部分會講解這兩年大紅大紫的Transformer和BERT模型，

3. 閱讀論文的正確姿勢

??很多同學不注重學習方法，不思考問題的本質就盲目的閱讀論文，表面上是勤奮，但實際上是戰略上的懶惰，由于本次學習任務主要是復現模型，而不是把握論文中的每一個細節，所以我們學習的重點是模型的架構和實作模型的一些重要技巧(包括一些重要引數的設定)，

??如果經過認真閱讀某一篇經典論文后，也無法提取到上述資訊，此時學習的正確姿勢是尋找是否存在別的經典論文，并再進行研讀，因為某些經典模型對應的paper往往不止一篇，如果再找不到，也可以尋找一些經典的博客進行學習，而不是本末倒置，一上來去學習博客，這是學習的大忌，

??可能對于部分同學來說，閱讀并復現論文有些困難，可以先學習我的專欄：機器學習入門之工具篇，

??最后再分享一個精心打磨的專欄： Al比賽教程，分享各類Al比賽（阿里云天池、科大訊飛等）前幾名隊伍的成功經驗，包括NLP，CV、語音、時序預測、資訊安全等方向，其中也包括自己取得的阿里云第一名的經驗分享，也包括打比賽提分的一些實用tricks ，從而更好的幫助新手入門資料科學競賽，

轉載請註明出處，本文鏈接：https://www.uj5u.com/qita/290786.html

標籤：AI

上一篇：深度學習100例-生成對抗網路（DCGAN）生成動漫小姐姐 | 第20天

下一篇：【OpenCV】 ??實戰?? 銀行卡卡號讀取

NLP經典模型復現之開宗明義

文章目錄

1. 為什么要寫這個專欄

2. 專欄的主要內容

3. 閱讀論文的正確姿勢