最近爬取的資料都是網頁端,今天來教大家如何爬取手機端app資料(本文以ios蘋果手機為例,其實安卓跟ios差不多)!
本文將以『某乎』為實戰案例,手把手教你從配置到代碼一步一步的爬取App資料!
2、配置抓包工具
1.安裝軟體
【資料領取】本文選擇的抓包工具:Fiddler
具體的下載安裝這里不詳細贅述!(網上搜Fiddler安裝,一大堆教程),本文以實戰為例,就不再這里浪費時間了!
2.配置Fiddler
安裝好之后,接下來就開始配置Fiddler工具(這里是關鍵,仔細閱讀!)
配置Connections
打開Fiddler后,點擊Tools->Options

點擊Connections

勾選上對應的選項
配置HTTPS
由于目前大部分APP都是https加密,包括本文實戰『某乎』案例也是https加密,因此配置HTTPS,來抓取https資料包!

勾選上對應的選項
最后抓包工具Fiddler就配置好了
記得重啟Fiddler!重啟Fiddler!重啟Fiddler!不然可能不生效
3、配置手機代理
1.設定代理
準備作業
【資料領取】 首先看一下安裝Fiddler主機ip(電腦和手機必須處于同一局域網)
查看ip命令
window:ipconfig
復制代碼

開始配置
目標代理主機資訊
ip:192.168.31.195
埠:8888
在wifi無線網處進去,點擊配置代理
【資料分享】
填寫好相關代理資訊

2.安裝證書
【資料領取】 在瀏覽器輸入:
http://192.168.31.195:8888
復制代碼

點擊下載證書后,下面就開始安裝(看圖操作)【資料領取】




ok,這樣手機端就配置完成,下面開始抓取資料!!!
4、抓取資料
1.打開某乎app

2.查看資料包串列
打開app之后,Fiddler就已經抓取到資料了

這里可以看到app發送和接收了哪些資料包
為了更加精準定位到某乎(只看目標的資料包),添加一個過濾條件

這樣我們獲取的資料包串列就都是過濾條件內的目標網址

3.查找資料包
比如點擊熱榜

對應的https加密資料包如下:

資料包中的資料如下:

提取出url鏈接

https://api.zhihu.com/topstory/hot-list?limit=10&reverse_order=0
復制代碼
拿到url之后,接著開始編程爬取保存資料,
4.撰寫爬蟲程式
# -*- coding: utf-8 -*-
復制代碼

ok這樣就可以將資料獲取下來!
5、總結
1.配置抓包工具Fiddler(重點),
2.ios蘋果手機配置證書和設定代理(安卓手機也類似),
3.簡單使用Fiddler(過濾資料包、查看資料包等),
4.本文以某戶為實戰,實作了python爬取手機app資料(詳細教程,推薦收藏),
需要相關python資料的可以加微信ssmp8858

轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/287389.html
標籤:python
上一篇:揭秘游戲服務器,不看后悔!!!
