文章目錄
- 一、為什么要使用動態代理ip?
- 二、如何申請動態代理ip?
- 三、如何使用動態ip?
- 四、我猜你還有的疑問
一、為什么要使用動態代理ip?
使用它的好處在哪里呢?
- 保護你的網路免受外部攻擊
- 屏蔽你的IP地址
- 限制不必要的內容
- 更好的幫助你抓取網路資料
- 繞過目標網站限制,網站一般會限制單個ip請求數量,使用動態ip可以自定義時間更換ip地址,提高爬蟲效率,
- 隱藏真實ip地址,出于各種安全原因,有些人選擇使用代理來隱藏其真實IP地址,
以上幾點,足以知道使用代理動態ip的好處,難不成還用自己電腦的ip呢?ip是能定位到你的好吧,所以咱一般不用自己的本地ip爬(簡單的本地爬,某些資料還是要使用代理ip哈)
二、如何申請動態代理ip?
我隨便使用的一個代理ip網站,反正你們隨便找個代理網站都行,看誰福利多就用誰的咯,這個我只是測驗,

生成代理api

點擊生成鏈接:

認證一下:

再回傳,點擊生成鏈接,復制鏈接(保存在檔案):

三、如何使用動態ip?
我們就是用最簡單的requests模塊:
import requests
然后我們再加上隨機請求頭模塊(反爬用):
from fake_useragent import UserAgent
匯入請求的url和隨機請求頭:
url='https://blog.csdn.net/weixin_46211269?spm=1011.2124.3001.5343'
headers={'User-Agent':UserAgent().random}
使用api獲取到ip:(記得換成你自己的api)
# proxies = {'協議': '協議://IP:埠號'}
api_url='http://tiqu.ipidea.io:81/abroad?num=1&type=1&lb=1&sb=0&flow=1®ions=&port=1'
res = requests.post(api_url,headers=headers, verify=True)
proxie = "https://%s"%(res.text)
proxies = {'http': proxie}
print(proxies)
請求網址(以我自己的博客鏈接為例子):
html=requests.get(url=url,headers=headers,proxies=proxies).text
print(html)
完整原始碼:
import requests
from fake_useragent import UserAgent
url='https://blog.csdn.net/weixin_46211269?spm=1011.2124.3001.5343'
headers={'User-Agent':UserAgent().random}
# proxies = {'協議': '協議://IP:埠號'}
api_url='http://tiqu.ipidea.io:81/abroad?num=1&type=1&lb=1&sb=0&flow=1®ions=&port=1'
res = requests.post(api_url,headers=headers, verify=True)
proxie = "https://%s"%(res.text)
proxies = {'http': proxie}
print(proxies)
html=requests.get(url=url,headers=headers,proxies=proxies).text
print(html)
運行如下:

更多案例和具體實戰我已經在前面的文章講過了,這里主要是教一下大家如何使用代理ip,只是在原來的基礎上加了一個代理ip,代理ip對于爬蟲手來說,用處很大,一定要學會哇!
四、我猜你還有的疑問
你看到本篇爬蟲教程的時候,你給我說你連python基礎都不會?那我推薦你看我的基礎教程專欄:python全堆疊基礎教程
專欄好不好,粉絲們說了算:

基礎學完后再來本專欄的爬蟲教程,一直都在更新,更新期間免費白嫖!三連好評一下,持續輸出優質能容,最近更新慢,寒假再卷你們,
轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/390398.html
標籤:其他
下一篇:[國 創]大一學生的第一個專案
