喜歡看電影來哦！教你如果使用Python網路爬蟲爬取豆瓣高分電影！-有解無憂

【一、專案背景】

豆瓣電影提供最新的電影介紹及評論包括上映影片的影訊查詢及購票服務，可以記錄想看、在看和看過的電影電視劇、順便打分、寫影評，極大地方便了人們的生活，

今天以電視劇（美劇）為例，批量爬取對應的電影，寫入csv檔案，用戶可以通過評分，更好的選擇自己想要的電影，

【二、專案目標】

獲取對應的電影名稱，評分，詳情鏈接，下載電影的圖片，保存檔案，

【三、涉及的庫和網站】

1、網址如下：

https://movie.douban.com/j/search_subjects?type=tv&tag=%E7%BE%8E%E5%89%A7&sort=recommend&page_limit=20&page_start={}

2、涉及的庫：requests****、fake_useragent、json****、csv

3、軟體：PyCharm

【四、專案分析】

1、如何多網頁請求?

點擊下一頁時，每增加一頁paged自增加20，用{}代替變換的變數，再用for回圈遍歷這網址，實作多個網址請求，

2、如何獲取真正請求的地址？

請求資料時，發現頁面上并沒有對應資料，其實豆瓣網采用javascript動態加載內容，防止采集，

1）F12右鍵檢查，找到Network，左邊選單Name , 找到第五個資料，點擊Preview，

2）點開subjects，可以看到 title 就是對應電影名稱，rate就是對應評分，通過js決議subjects字典，找到需要的欄位，

如何網頁訪問？

https://movie.douban.com/j/search_subjects?type=tv&tag=%E7%BE%8E%E5%89%A7&sort=recommend&page_limit=20&page_start=0



https://movie.douban.com/j/search_subjects?type=tv&tag=%E7%BE%8E%E5%89%A7&sort=recommend&page_limit=20&page_start=20



https://movie.douban.com/j/search_subjects?type=tv&tag=%E7%BE%8E%E5%89%A7&sort=recommend&page_limit=20&page_start=40



https://movie.douban.com/j/search_subjects?type=tv&tag=%E7%BE%8E%E5%89%A7&sort=recommend&page_limit=20&page_start=60

當點擊下一頁時，每增加一頁page自增加20，用{}代替變換的變數，再用for回圈遍歷這網址，實作多個網址請求，

【五、專案實施】

1、我們定義一個class類繼承object，然后定義init方法繼承self，再定義一個主函式main繼承self，匯入需要的庫和請求網址，