目錄
前言
分析(x0)
分析(x1)
分析(x2)
代碼
效果
結語
前言
告知:本人所有文章,禁止轉載,
大家好,我叫善念,連續更新了幾篇原創文章了,可也見不到什么反響,也許是我發的文章內容過于簡單,沒有什么價值,也許也是有一些運氣的成分,不懂得如何去運營,
?
但我都會堅持下去,萬一有一天它就爆發了呢?
?
這次給大家帶來的是一個2500的爬蟲外包專案,在這里肯定有人說這個不值這么多,也有人會各種嘲諷,但是別忘了,人的眼界不一樣,做事的決定自然會不同,
如果2500能給你帶來25000的利潤,那么你會選擇毫不猶豫的支付嗎?話不多說,看聊天記錄,
還是挺久以前做的了,(我后面再給大家一一道來,暫時先看咱們的教程,)
?
分析(x0)
進入目標網站:目標網站
很多人學習蟒蛇,不知道從何學起, 很多人學習python,掌握了基本語法之后,不知道在哪里尋找案例上手, 很多已經做了案例的人,卻不知道如何去學習更多高深的知識, 那么針對這三類人,我給大家提供一個好的學習平臺,免費獲取視頻教程,電子書,以及課程的源代碼! QQ群:101677771 歡迎加入,一起討論一起學習!
?
隨便進入一個分類,點擊進入某直播間
?
當我們點擊彈幕直播框時,它會要求咱們登錄賬號,這也實屬正常,沒辦法那咱們就登錄吧,
登錄成功后,咱們抓一下這個發送彈幕的包:
?
確實尷尬,我不知道發送什么,就說了句您好,沒想到小姐姐很驚訝地說您好,您也好......然后說聽完一首《飄向北方》就下播了......我不知道他下播了后,我還是否可以發送彈幕,
不管了,我先抽支煙看看小姐姐聽完這首歌再接著寫,
emmm,roomid為直播間的房間號,content為我發送的內容,
roomid可以在url中看得到的,前面那個圖我沒截出來,自己看一下就知道了,
?
t為時間戳,sign簽名也是JavaScript加密的,其它值不變,自己發送兩次彈幕抓包對比一下就好了,
分析(x1)
有人會奇怪你怎么知道t為時間戳......這玩意還需要說么,還是說一下吧,查找一下t的來源,我覺得像這種短的引數,最好別直接搜t,你會搜出來一大堆的,我建議搜臨近的值sign,因為你提交的表單中有這么多的引數,那么在js檔案中基本也會有相對應的引數的,
?
t:i意思是把i賦值給t,而
i = (new Date).getTime()
哦豁,沒學過前端的人就看不懂這個是啥意思了,這個其實就是JavaScript語法中的取現行時間,
再用我們的鬼鬼js除錯工具看看效果:
?
可以看到它是一直在變化的,就像咱們的時間一樣一直在流逝變化,不懂什么是時間戳的自己去谷歌一下,
或者在咱們的控制臺上也可以得到它:
?
既然它是利用JavaScript這么個語法生成的引數,那么我們用Python如何實作?
?
OK,至此已經解決第一個加密的引數,
分析(x2)
接下來就是大頭菜了,咱們分析sign簽名是如何得到的:
好吧,很多位置引數,壓根不知道是如何得來的但是可以看到它用到 i 這個引數,也就是咱們的時間戳,
還是debug一下吧:
?
打個斷點,在瀏覽器上隨意發送一彈幕,發現g就是appkey是一個定值,c為一個字典,咱們要取的是c字典中data鍵所對應的值:
?
是不是好熟悉,這不就是咱們post中的data的值么?那么就只剩下d了,
d為一個字典,而咱們需要的是d里面的一個叫token鍵對應的值:
?
憑我經驗,這個d根本不需咱們去找它應該就是咱們的cookies,直接搜一下就完事了......
?
那么到此為止,咱們的所有引數都已經分析完了,咱們開始測驗一下:
?
發現缺少物件,emmmmm我三十歲的人都沒物件......這里毫無疑問就是少了h這個函式物件,
那么咱們去給它找出來即可
點一下這個花括號,然后這樣子的話函式末也有出現這么一個橫杠,然后把JavaScript代碼摳下來再來測驗:
?
OK,到此為止,咱們已經完成了百分之五十了,為什么最核心的部分完成確只完成百分之五十呢?因為這個專案為三個程式:自動對接接嗎臺子注冊賬號、房間ID號采集篩選出主播在線的ID號、咱們這個的話就是關鍵的發送程式,
代碼
Python代碼:
import requests
import execjs
import time
# 攜帶cookies進入主頁
ck = '123456'
headers = {
'authority': 'www.laifeng.com',
'method': 'GET',
'path': '/?',
'scheme': 'https',
'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9',
'accept-encoding': 'gzip, deflate, br',
'accept-language': 'zh-CN,zh;q=0.9,en-US;q=0.8,en;q=0.7',
'cache-control': 'no-cache',
'cookie': ck,
'pragma': 'no-cache',
'sec-ch-ua-mobile': '?0',
'sec-fetch-dest': 'document',
'sec-fetch-mode': 'navigate',
'sec-fetch-site': 'none',
'sec-fetch-user': '?1',
'upgrade-insecure-requests': '1',
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3870.400 QQBrowser/10.8.4405.400',
}
url = 'https://www.laifeng.com/'
r = requests.get(url, headers=headers)
print(r.text)
# 進入直播間
url = f'https://v.laifeng.com/711329'
headers = {
'authority': 'v.laifeng.com',
'method': 'GET',
'path': '/711329',
'scheme': 'https',
'accept': 'application/json, text/javascript, */*; q=0.01',
'accept-encoding': 'gzip, deflate, br',
'accept-language': 'zh-CN,zh;q=0.9,en-US;q=0.8,en;q=0.7',
'cache-control': 'no-cache',
# 'cookie': 'mk=453ed14d2f6e4871ba8f09cfefcba1a3; cna=XacYGCzzLgkCAW411IXRpIVk; P_ck_ctl=5633DEE6E3B29B5783C835500682978B; xlly_s=1; P_ck_ctr=870A7039ED41E1AF8A4E5AF9A7D413C5; premium_cps=0_0%7C76%7C85232%7C0___; cmk=80ff16e81ec844f7946cfb91262dc197; P_pck_rm=z99ATxqw33e2f40cb442c0ZBnFgC5IrE%2BWMeN4%2BR%2BFlfXo6CU2HuinwjayRmNzYP5BIz5HRZzLPXYEPoNGojmxulCSHs6dFdWS1WNMYs6WkVelQxcsN%2FkHwmDvakV1b8hA0MqQXvBvTdMeakZiDzsBNT%2BuFifi6PNbRVoQ%3D%3D%5FV2; P_gck=NA%7CPmRanzni%2BsGuV8NRBrUBaw%3D%3D%7CNA%7C1621735722621; P_sck=8agJlNkqujZS6MrSyNJwjanMcMbXipu2qC%2BxD4UmyvNoTDHSq7Nah1Epvqm%2FaUXXcspBt9AU9cvP8ksA8NHQKpdD9h1%2Bd0oOFKVzm2HD0ZkEUaPPVJ28NNQmgMPfzqvrbS6Rz1TAHSvGhiEJt9gmuQ%3D%3D; uk=1362040016; anchor-task-tips=vistived; fansTuan-tips=vistived; _m_h5_tk=298bfbf0d1f474b3cd1e7566f68193a1_1621744352184; _m_h5_tk_enc=2d0745b898b59366cf07b6efa7cd875b; isg=BGVlUl6Rac0flo0Rbvh1ju8VdCGfohk0iyhzDmdLjxyrfoTwL_CVBFBWCOII_jHs; imk=MTM2MjA0MDAxNi0xLTE2MjE3NDA2ODg4MDUtMTYyMTgyNzA4ODgwNQ%3D%3D-FC64AFD62649932D1C07520D9BCA6A50; __ysuid=1621740688797e9b',
'pragma': 'no-cache',
'sec-ch-ua-mobile': '?0',
'sec-fetch-dest': 'empty',
'sec-fetch-mode': 'cors',
'sec-fetch-site': 'same-origin',
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3870.400 QQBrowser/10.8.4405.400',
'x-requested-with': 'XMLHttpRequest',
}
r = requests.get(url, headers=headers)
print(r)
print(r.text)
# 獲取sign
t = str(int(time.time()*1000))
with open('js1.js', 'r', encoding='utf-8') as f:
ctx = execjs.compile(f.read())
sign = ctx.call('test', '{"roomId":"711329","content":"找個壯男薇123456"}', t)
print(sign)
# 發送彈幕
url = f'https://acs.laifeng.com/h5/mtop.youku.live.platform.chat/1.0/?jsv=2.6.1&appKey=24679788&t={t}&sign={sign}&type=originaljson&dataType=json&api=mtop.youku.live.platform.chat&v=1.0&ecode=1'
data = https://www.cnblogs.com/pythonQqun200160592/archive/2021/12/11/{
'data': '{"roomId":"711329","content":"找個壯男薇123456"}'
}
headers = {
'authority': 'acs.laifeng.com',
'method': 'POST',
'path': f'/h5/mtop.youku.live.platform.chat/1.0/?jsv=2.6.1&appKey=24679788&t={t}&sign={sign}&type=originaljson&dataType=json&api=mtop.youku.live.platform.chat&v=1.0&ecode=1',
'scheme': 'https',
'accept': 'application/json',
'accept-encoding': 'gzip, deflate, br',
'accept-language': 'zh-CN,zh;q=0.9,en-US;q=0.8,en;q=0.7',
'cache-control': 'no-cache',
'content-length': '65',
'content-type': 'application/x-www-form-urlencoded',
# 'cookie': 'mk=453ed14d2f6e4871ba8f09cfefcba1a3; cna=XacYGCzzLgkCAW411IXRpIVk; xlly_s=1; cmk=80ff16e81ec844f7946cfb91262dc197; P_gck=NA%7CPmRanzni%2BsGuV8NRBrUBaw%3D%3D%7CNA%7C1621735722621; uk=1362040016; anchor-task-tips=vistived; fansTuan-tips=vistived; P_sck=%2BUdo1iqrKx4%2FVd0vPYAbiHOpyqJ39%2Fw8brn2mmb2jYLlctldDNJ2qXSzYFPJDEYzodI65rDbJDzRtM6T7xkFNfREb9ajH8aAhsEioWLTbTp9LqNh%2ByYY7yW43dhpBBcSerlcOCmoajgMf%2BWzmhN7zw%3D%3D; P_pck_rm=z99ATxqw33e2f40cb442c0ZBnFgC5IrE%2BWMeN4%2BR%2BFlfXo6CU2HuinwjayRmNzYP5BIz5HRZzLPXYEPoNGojmxulCSHs6dFdWS1WNMYs6WkVelQxcsN%2FkHwmDvakV1b8hA0MqQXvBvTdMeakZiDzsBNT%2BuFifi6PNbRVoQ%3D%3D_V2; _m_h5_tk=83a19c51d0630a852efa9b4189393fca_1621764171783; _m_h5_tk_enc=2346991bccefcfc40b4ddb78c83c888f; __ysuid=1621760043001XhI; imk=MTM2MjA0MDAxNi0xLTE2MjE3NjAwNDM3MTAtMTYyMTg0NjQ0MzcxMA%3D%3D-1AEDB0971C2FA6CB9B62CAA7858E1C42; isg=BNHRDPTLVUpHT7ldmhTZitMx4N1rPkWwB8xnQrNkNxiMWvOs-ouggV6o_i68yd3o',
'cookie': ck,
'origin': 'https://v.laifeng.com',
'pragma': 'no-cache',
'referer': 'https://v.laifeng.com/711329',
'sec-ch-ua-mobile': '?0',
'sec-fetch-dest': 'empty',
'sec-fetch-mode': 'cors',
'sec-fetch-site': 'same-site',
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3870.400 QQBrowser/10.8.4405.400',
}
r = requests.post(url, headers=headers, data=https://www.cnblogs.com/pythonQqun200160592/archive/2021/12/11/data)
print(r)
print(r.text)
需要自己手動拿下登錄頁碼的cookies,然后自己更改好發送的內容與房間id即可,
JavaScript原始碼:
function h(a) {
function b(a, b) {
return a << b | a >>> 32 - b
}
function c(a, b) {
var c, d, e, f, g;
return e = 2147483648 & a,
f = 2147483648 & b,
c = 1073741824 & a,
d = 1073741824 & b,
g = (1073741823 & a) + (1073741823 & b),
c & d ? 2147483648 ^ g ^ e ^ f: c | d ? 1073741824 & g ? 3221225472 ^ g ^ e ^ f: 1073741824 ^ g ^ e ^ f: g ^ e ^ f
}
function d(a, b, c) {
return a & b | ~a & c
}
function e(a, b, c) {
return a & c | b & ~c
}
function f(a, b, c) {
return a ^ b ^ c
}
function g(a, b, c) {
return b ^ (a | ~c)
}
function h(a, e, f, g, h, i, j) {
return a = c(a, c(c(d(e, f, g), h), j)),
c(b(a, i), e)
}
function i(a, d, f, g, h, i, j) {
return a = c(a, c(c(e(d, f, g), h), j)),
c(b(a, i), d)
}
function j(a, d, e, g, h, i, j) {
return a = c(a, c(c(f(d, e, g), h), j)),
c(b(a, i), d)
}
function k(a, d, e, f, h, i, j) {
return a = c(a, c(c(g(d, e, f), h), j)),
c(b(a, i), d)
}
function l(a) {
for (var b, c = a.length,
d = c + 