前言:今天要總結的是如何用程式來實作短信發送功能,但是呢,可能需要我們呼叫一些api介面,我會詳細介紹,都是自己學到的,害怕忘記,所以要總結一下,讓寫博客成為一種堅持的信仰,廢話不多說,我們開始吧!
網路爬蟲實作發送短信驗證碼
在實作我們目標的功能之前,我們要有自己的思路,否則你沒有方向,又如何實作自己的代碼功能呢?
我們要發送短信,那么我們其實是需要分析的,我們可以去分析一個可以發送短信的網站頁面,
我們來到這里如下:

可以看到這是一個注冊界面,我們在注冊時會被要求需要填寫手機號碼的·,其實還有一欄驗證碼識別,像這里打開沒有,那你就填寫幾個號碼,發送,多重繪幾次,就可以了,
不為別人添麻煩,我填寫自己的號碼,
多次重繪會出現,不過要填寫不同的手機號碼,你們懂的,我們要看到這個有驗證碼的界面,

我們打開chrome谷歌抓包工具,也就是郵件檢查即可,我們點擊network直接進行抓包,記得在抓包前最好清除下面出現的一切包,我們要點擊驗證碼,讓網頁做出反應,然后同步一下,進行抓包,

當我們填寫手機號以后,我們只要點擊那個驗證碼,然后進行抓包如下

看到沒有,其實點擊同步瞬間只有一個資料包的,在你做其他的動作時,可能會出現其他的資料包,但是與此無關,
我們直接點進去看

我們看這個url
https://uc.creditcard.ecitic.com/citiccard/ucweb/newvalicode.do?time=1613969346256
我們打開這個url看看廬山真面目
留意觀察這個time引數,很明顯是一個時間戳引數
時間戳引數又是什么概念呢?這里有必要介紹一下
時間戳 : 格林威治時間1970年1月0點0分0秒到目前為止
秒級時間戳:10數字
毫秒級時間戳 :13位數字
微秒級時間戳:16位數字
可以看到這個time引數屬于毫秒級別的時間戳的,
我們訪問這個見面,每次重繪都會有不同的驗證碼,回傳當前的時間,如果我們要獲取當前的驗證碼,我們需要url,前面的引數都一樣,只有time,我們需要獲取time時間,如何獲取呢,
python中有一個time庫,我們匯入,來看如何使用,
下面展示一些 行內代碼片,
import time
def get_time() :
" 獲取當前的時間戳"
now_time =str(int(time.time()*1000))#獲取毫秒級的時間戳
print('當前的時間戳',now_time)
return now_time
get_time()
來看運行結果
我們目前可以這樣去做

我們把這個獲取到的時間戳引數加入到url中,我們可以實作動態的獲取,每次要要獲取這個二維碼時就需要指定當前的時間time引數,那我們完全可以這樣來構造這個url,我們用一個變數來接識訓取的時間戳,然后以字串的形式加入到time后面,
下面展示一些 行內代碼片,
import time
def get_time() :
" 獲取當前的時間戳"
now_time =str(int(time.time()*1000))#獲取毫秒級的時間戳
print('當前的時間戳',now_time)
return now_time
time_one = get_time()
img_url = 'https://uc.creditcard.ecitic.com/citiccard/ucweb/newvalicode.do?time='+time_one
print(img_url)
我們來看是否可以獲取到相應正確的url

我們點入那個藍色的鏈接,來看有沒有獲取到這個驗證碼圖片,

測驗證明我們完全是對的,
下一步我們要做的是實作代碼的訪問,獲取并保存這個驗證碼,為什么保存,我們應該知道這點知識,
看這三個提交欄,很明顯是一個要提交表單的,提交那就需要post,而post請求呢,就是要提交我們的資料,及手機號碼和圖形驗證碼,
當我們把資料提交上去以后,我們在手機上就會收到短信驗證碼,我們以此來實作發送短信驗證碼的功能,
我們來保存圖片驗證碼
下面展示一些 行內代碼片,
import time
import requests
def get_time() :
" 獲取當前的時間戳"
now_time =str(int(time.time()*1000))#獲取毫秒級的時間戳
print('當前的時間戳',now_time)
return now_time
time_one = get_time()
img_url = 'https://uc.creditcard.ecitic.com/citiccard/ucweb/newvalicode.do?time='+time_one
print(img_url)
headers = {
'User-Agent' :'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.150 Safari/537.36'
}
response = requests.get(url=img_url,headers = headers)
img_data = response.content
with open('yzm.jpg',mode = 'wb') as file :
file.write(img_data)

可以看到在代碼編輯器右邊已經出現了保存的圖片,
下一步我們繼續來分析這個手機號碼的資料和圖片驗證碼的資料在哪里傳入,又是如何實作,
我們輸入一個手機號碼,然后輸入圖片驗證碼,然后點擊免費獲取,此時再次進行抓包,抓包的方法與上文的第一次抓包方法相同,
我們來看會出現什么樣的包,

藍色部分的就是我們尋找的目標包,然后我們如何去做?點擊打開查看相應的代碼,

看到沒有post請求,是因該提交表單資料的,我們看看下面的表單資料
這里你會發現有一點不同電話號碼是直接的數字,圖片驗證碼就需要你來處理了,因為我們上文保存的驗證碼是圖片,你如何識別到這圖片驗證碼里面額資料,來進行傳入呢?這里我們還需要一個網站,
超級鷹,是用來識別驗證碼的,其實我們還是呼叫這個介面,

我們點擊開發檔案,我們是用Python寫的代碼,所以我們點擊python的圖示,來這里來查看我們需要的,

在下面找到超級鷹影像識別,然后點擊下載,把里面的api介面的py檔案匯入到你的python編輯器,我這里是用Pycharm寫的,所以直接將解壓出來的Python檔案拖入pycharm,

下面是里面的部分代碼,

這里面做了小小的修改,我們直接來看這段代碼寫了什么,
我來告訴大家原始的代碼有問題,很低級的問題,
#!/usr/bin/env python
# coding:utf-8
import requests
from hashlib import md5
class Chaojiying_Client(object):
def __init__(self, username, password, soft_id):
self.username = username
password = password.encode('utf8')
self.password = md5(password).hexdigest()
self.soft_id = soft_id
self.base_params = {
'user': self.username,
'pass2': self.password,
'softid': self.soft_id,
}
self.headers = {
'Connection': 'Keep-Alive',
'User-Agent': 'Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0)',
}
def PostPic(self, im, codetype):
"""
im: 圖片位元組
codetype: 題目型別 參考 http://www.chaojiying.com/price.html
"""
params = {
'codetype': codetype,
}
params.update(self.base_params)
files = {'userfile': ('ccc.jpg', im)}
r = requests.post('http://upload.chaojiying.net/Upload/Processing.php', data=params, files=files, headers=self.headers)
return r.json()
def ReportError(self, im_id):
"""
im_id:報錯題目的圖片ID
"""
params = {
'id': im_id,
}
params.update(self.base_params)
r = requests.post('http://upload.chaojiying.net/Upload/ReportError.php', data=params, headers=self.headers)
return r.json()
if __name__ == '__main__':
chaojiying = Chaojiying_Client('超級鷹用戶名', '超級鷹用戶名的密碼', '96001') #用戶中心>>軟體ID 生成一個替換 96001
im = open('a.jpg', 'rb').read() #本地圖片檔案路徑 來替換 a.jpg 有時WIN系統須要//
print chaojiying.PostPic(im, 1902) #1902 驗證碼型別 官方網站>>價格體系 3.4+版 print 后要加()
上面這個是他的原始介面代碼,就很離譜,分塊來分析,
def __init__(self, username, password, soft_id):
self.username = username
password = password.encode('utf8')#沒有縮進
self.password = md5(password).hexdigest()
self.soft_id = soft_id
.......
.......
這塊的錯誤在哪呢?我這里特意表明突出,上面的原始代碼直接沾到這里并不突出,但是你用編輯器打開會有問題的,
if __name__ == '__main__':
chaojiying = Chaojiying_Client('超級鷹用戶名', '超級鷹用戶名的密碼', '96001') #用戶中心>>軟體ID 生成一個替換 96001
im = open('a.jpg', 'rb').read() #本地圖片檔案路徑 來替換 a.jpg 有時WIN系統須要//
print chaojiying.PostPic(im, 1902) #print沒有加 () #1902 驗證碼型別 官方網站>>價格體系 3.#4+版 print 后要加()
還有一處,在這里,代碼格式都沒有寫對,我這里指出,讀者應該可以發現,這里介意讀者可以去平臺下載這個介面,自己去修改,
好,且不在談這些,我們繼續,我們還是修改部分代碼,
def ReportError(self, im_id):
"""
im_id:報錯題目的圖片ID
"""
params = {
'id': im_id,
}
params.update(self.base_params)
r = requests.post('http://upload.chaojiying.net/Upload/ReportError.php', data=params, headers=self.headers)
return r.json()
if __name__ == '__main__':
chaojiying = Chaojiying_Client('超級鷹用戶名', '超級鷹用戶名的密碼', '96001') #用戶中心>>軟體ID 生成一個替換 96001
im = open('a.jpg', 'rb').read() #本地圖片檔案路徑 來替換 a.jpg 有時WIN系統須要//
print chaojiying.PostPic(im, 1902) #這是原始的代碼 #1902 驗證碼型別 官方網站>>價格體系 3.4+版 print 后要加()
我們可以在這內部寫一個方法,我們待會要呼叫這個代碼介面時,直接呼叫這個方法,
注意我們在類里面添加這樣一部分代碼,就是寫一個方法
def run(self):
chaojiying = Chaojiying_Client(constant.USER_NAME, constant.PASSWORD,
913137) # 用戶中心>>軟體ID 生成一個替換 96001
im = open('yzm.jpg', 'rb').read() # 本地圖片檔案路徑 來替換 a.jpg 有時WIN系統須要//
result = chaojiying.PostPic(im, 1004) # 1902 驗證碼型別 官方網站>>價格體系 3.4+版 print 后要加()
return result['pic_str']
注意分析這個介面代碼,里面 chaojiying = Chaojiying_Client(constant.USER_NAME, constant.PASSWORD,913137)
在注釋里面其實說的已經很清楚了,這里的constant代表我們要匯入的py檔案,里面包含你的用戶名,密碼,以及軟體id,
im = open(‘yzm.jpg’, ‘rb’).read() 打開你保存的驗證碼檔案,上面我們已經保存過,
result = chaojiying.PostPic(im, 1004) 1004代表你的驗證碼型別,
用戶名和密碼你需要注冊一下,那么軟體id和驗證碼型別你該如何確定呢?
這是主頁,請點擊價格體系

在下面你可以來判斷你的驗證碼型別了

我們這里需要登錄進入用戶中心

進入如下界面

往下拉進入軟體id

進入后點擊生成一個軟體id,軟體名稱和軟體說明可以隨便填寫

這樣我們就可以獲得一個軟體id ,
這個constant如何撰寫,很簡單,建立一個py檔案,里面寫入
USER_NAME=’ …’
PASSWORD=’… ’
然后保存即可,匯入py檔案到當前路勁,然后import即可,
現在我們來看完整的代碼
介面完整修改后的代碼
import requests
from hashlib import md5
import constant
import constant
class Chaojiying_Client(object):
def __init__(self, username, password, soft_id):
self.username = username
self.password = md5(password.encode('utf8')).hexdigest()
self.soft_id = soft_id
self.base_params = {
'user': self.username,
'pass2': self.password,
'softid': self.soft_id,
}
self.headers = {
'Connection': 'Keep-Alive',
'User-Agent': 'Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0)',
}
def PostPic(self, im, codetype):
"""
im: 圖片位元組
codetype: 題目型別 參考 http://www.chaojiying.com/price.html
"""
params = {
'codetype': codetype,
}
params.update(self.base_params)
files = {'userfile': ('ccc.jpg', im)}
r = requests.post('http://upload.chaojiying.net/Upload/Processing.php', data=params, files=files,
headers=self.headers)
return r.json()
def ReportError(self, im_id):
"""
im_id:報錯題目的圖片ID
"""
params = {
'id': im_id,
}
params.update(self.base_params)
r = requests.post('http://upload.chaojiying.net/Upload/ReportError.php', data=params, headers=self.headers)
return r.json()
def run(self):
chaojiying = Chaojiying_Client(constant.USER_NAME, constant.PASSWORD,
913137) # 用戶中心>>軟體ID 生成一個替換 96001
im = open('yzm.jpg', 'rb').read() # 本地圖片檔案路徑 來替換 a.jpg 有時WIN系統須要//
result = chaojiying.PostPic(im, 1004) # 1902 驗證碼型別 官方網站>>價格體系 3.4+版 print 后要加()
return result['pic_str']
if __name__ == '__main__':
chaojiying = Chaojiying_Client(constant.USER_NAME, constant.PASSWORD, 913137) # 用戶中心>>軟體ID 生成一個替換 96001
im = open('yzm.jpg', 'rb').read() # 本地圖片檔案路徑 來替換 a.jpg 有時WIN系統須要//
result = chaojiying.PostPic(im, 1004)
print(chaojiying.PostPic(im,1004))# 1902 驗證碼型別 官方網站>>價格體系 3.4+版 print 后要加()
主檔案代碼,從這里執行
import time
import requests
from chaojiying import Chaojiying_Client
import constant
def get_time() :
" 獲取當前的時間戳"
now_time =str(int(time.time()*1000))#獲取毫秒級的時間戳
print('當前的時間戳',now_time)
return now_time
time_one = get_time()
img_url = 'https://uc.creditcard.ecitic.com/citiccard/ucweb/newvalicode.do?time='+time_one
print(img_url)
headers = {
'User-Agent' :'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.150 Safari/537.36'
}
response = requests.get(url=img_url,headers = headers)
img_data = response.content
with open('yzm.jpg',mode = 'wb') as file :
file.write(img_data)
print(response)
#驗證碼識別
code = Chaojiying_Client(constant.USER_NAME,constant.PASSWORD,913137).run()
print('識別出來的驗證碼為',code)
#請求保證同一個用戶
cookiejar = response.cookies
cookies = cookiejar.get_dict()
print(cookies)
data = {
'phone' :19745678397,
'imgValidCode' : code,
}
time_two = get_time()
code_url = 'https://uc.creditcard.ecitic.com/citiccard/ucweb/getsms.do?×tamp'+time_two
requests_two = requests.post(url=code_url,data= data,headers=headers,cookies=cookies)
print(requests_two.json())
我們來看運行結果

ok,短信發送成功
需要注意的是,如果你發送多次的話,那么會出現提醒你短信發送頻率過高的提示,這是服務器的回應,
我們總結一下該程式實作了發送驗證碼的功能,如果你需要實作發送你想要的文本,那么你需要呼叫其它的介面,別的就不多說了,畢竟爬蟲也需要講武德,
相關的請遵守csdn博客協議
--------jgdabc 點擊訪問主頁
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/262564.html
標籤:python
下一篇:使用python制作查q綁程式
