python爬取分析超級大樂透歷史開獎資料
博主作為爬蟲初學者,本次使用了requests和beautifulsoup庫進行資料的爬取
爬取網站:http://datachart.500.com/dlt/history/history.shtml —500彩票網
(分析后發現網站源代碼并非是通過頁面跳轉來查找不同的資料,故可通過F12查找network欄找到真正儲存所有歷史開獎結果的網頁)
如圖:
爬蟲部分:
from bs4 import BeautifulSoup #參考BeautifulSoup庫
import requests #參考requests
import os #os
import pandas as pd
import csv
import codecs
lst=[]
url='http://datachart.500.com/dlt/history/newinc/history.php?start=07001&end=21018'
r = requests.get(url)
r.encoding='utf-8'
text=r.text
soup = BeautifulSoup(text, "html.parser")
tbody=soup.find('tbody',id="tdata")
tr=tbody.find_all('tr')
td=tr[0].find_all('td')
for page in range(0,14016):
td=tr[page].find_all('td')
lst.append([td[0].text,td[1].text,td[2].text,td[3].text,td[4].text,td[5].text,td[6].text,td[7].text])
with open("Lottery_data.csv",'w') as csvfile:
writer = csv.writer(csvfile)
writer.writerow(['期號','號碼1', '號碼2', '號碼3', '號碼4', '號碼5', '號碼6', '號碼7'])
writer.writerows(lst)
csvfile.close()
資料分析:
首先展示所有的彩票期號以及相應的中獎數字

而后通過5+2的模式分別初步分析最高頻次的兩組資料組合,比較模糊的計算出了本組合中獎概率為平均中獎幾率的3倍(最終結果不直接展示而是在csv檔案中以紅色標明)

源代碼以及相應csv檔案
鏈接:https://pan.baidu.com/s/16wEHnpvrzMsK1ijW0AkhiA
提取碼:nmjx
tips:感謝大家的一鍵三連~另外,有不足之處大可向博主當面指出!!
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/262566.html
標籤:python
上一篇:使用python制作查q綁程式
