快過年了,手頭有點緊,但是作為一個男人,身上怎么能夠沒有大把鈔票呢?
于是我決定用Python來分析一波股票,贏了會所嫩*,輸了下海干活!

好了,上面是我吹牛逼的,不過確實有小伙伴看了爬股票資料進行分析的教程中過,但是我還是不建議各位去碰這玩意,今天咱們就是純純的分享技術哈~

準備作業
既然要去賺馬內,咱們首先要獲取往期的資料來進行分析,通過往期的規律來對當前進行預測,準不準我不知道,反正比人預測的準,不準也不要噴我,咱們是來交流技術的,不是來炒股的,
我們需要使用這些模塊,通過pip安裝即可,
不會安裝模塊可以看我往期文章:如何安裝python模塊, python模塊安裝失敗的原因以及解決辦法
后續使用的其它的模塊都是Python自帶的,不需要安裝,直接匯入使用即可,
requests: 爬蟲資料請求模塊
pyecharts: 資料分析 可視化模塊
pandas: 資料分析 可視化模塊里面的設定模塊(圖表樣式)
獲取資料部分
爬蟲的基本流程
思路分析
采集什么資料?怎么采集?
首先我們找到資料來源,從network當中去找到資料所在的位置,這一步就不詳細講了,
可以看我往期文章:Python爬蟲何如抓包?這三個案例手把手教會你,非常詳細!
代碼實作
我們想要實作通過爬蟲獲取到資料,正常情況下有幾個步驟:
- 發送請求
- 獲取資料
- 決議資料
- 保存資料
接下來我們來看代碼
代碼展示
匯入需要使用的模塊
import requests # 資料請求模塊 import csv # 表格模塊
1、發送請求
通過response模塊來訪問需要獲取資料的地址
url = 'https://stock.xueqiu.com/v5/stock/screener/quote/list.json?page={page}&size=30&order=desc&orderby=percent&order_by=percent&market=CN&type=sh_sz' requests.get(url=url)
假設目標網址是你剛認識的妹子家,你能穿的破破爛爛,臟不溜秋的就進去嗎?肯定得打扮一番,把自己偽裝的人模狗樣的才讓你進去對不對,不然就被趕出來了,
同理,直接這么進去是不一定能獲取到資料,所以需要使用 cookie 來偽裝一下,cookie代表著用戶身份資訊,
當然光cookie是不夠的,咱們再加上當前網頁的 user-agent
偽裝加好之后,咱們就能得到一個相應結果,先列印出來看看,
import requests # 第三方模塊 import csv # 我錄制了詳細講解的視頻,以及源代碼都在這個君羊708525271自取就好了 # 偽裝 headers = { # 用戶身份資訊 'cookie': 's=bq119wflib; device_id=90ec0683f24e4d1dd28a383d87fa03c5; xq_a_token=df4b782b118f7f9cabab6989b39a24cb04685f95; xqat=df4b782b118f7f9cabab6989b39a24cb04685f95; xq_r_token=3ae1ada2a33de0f698daa53fb4e1b61edf335952; xq_id_token=eyJ0eXAiOiJKV1QiLCJhbGciOiJSUzI1NiJ9.eyJ1aWQiOi0xLCJpc3MiOiJ1YyIsImV4cCI6MTY3MjE4Njc1MSwiY3RtIjoxNjcwNTAxMjA5MTEyLCJjaWQiOiJkOWQwbjRBWnVwIn0.iuLASkwB6LkAYhG8X8HE-M7AM0n0QUULimW1C4bmkko-wwnPv8YgdakTC1Ju6TPQLjGhMqHuSXqiWdOqVIjy_OMEj9L_HScDot-7kn63uc2lZbEdGnjyF3sDrqGBCpocuxTTwuSFuQoQ1lL7ZWLYOcvz2pRgCw64I0zLZ9LogQU8rNP-a_1Nc91V8moONFqPWD5Lt3JxqcuyJbmb86OpfJZRycnh1Gjnl0Aj1ltGa4sNGSMXoY2iNM8NB56LLIp9dztEwExiRSWlWZifpl9ERTIIpHFBq6L2lSTRKqXKb0V3McmgwQ1X0_MdNdLAZaLZjSIIcQgBU26T8Z4YBZ39dA; u=511670501221348; Hm_lvt_1db88642e346389874251b5a1eded6e3=1667994737,1670480781,1670501222; Hm_lpvt_1db88642e346389874251b5a1eded6e3=1670501922', # 瀏覽器的基本資訊 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/108.0.0.0 Safari/537.36' } url = 'https://stock.xueqiu.com/v5/stock/screener/quote/list.json?page={page}&size=30&order=desc&orderby=percent&order_by=percent&market=CN&type=sh_sz' # 1. 發送請求 response = requests.get(url=url, headers=headers) print(response)

運行后出現 <Response [200]>求請求成功,出現404就是訪問不到資源,一般是被反爬了,
所以這時候我們需要加一個 referer 防盜鏈引數進去
'referer: https://xueqiu.com/hq'
如果加了還不行,就是自己鏈接有問題了,
取資料的話 .json 就好了
import requests # 第三方模塊 import csv # 偽裝 headers = { # 用戶身份資訊 'cookie': 's=bq119wflib; device_id=90ec0683f24e4d1dd28a383d87fa03c5; xq_a_token=df4b782b118f7f9cabab6989b39a24cb04685f95; xqat=df4b782b118f7f9cabab6989b39a24cb04685f95; xq_r_token=3ae1ada2a33de0f698daa53fb4e1b61edf335952; xq_id_token=eyJ0eXAiOiJKV1QiLCJhbGciOiJSUzI1NiJ9.eyJ1aWQiOi0xLCJpc3MiOiJ1YyIsImV4cCI6MTY3MjE4Njc1MSwiY3RtIjoxNjcwNTAxMjA5MTEyLCJjaWQiOiJkOWQwbjRBWnVwIn0.iuLASkwB6LkAYhG8X8HE-M7AM0n0QUULimW1C4bmkko-wwnPv8YgdakTC1Ju6TPQLjGhMqHuSXqiWdOqVIjy_OMEj9L_HScDot-7kn63uc2lZbEdGnjyF3sDrqGBCpocuxTTwuSFuQoQ1lL7ZWLYOcvz2pRgCw64I0zLZ9LogQU8rNP-a_1Nc91V8moONFqPWD5Lt3JxqcuyJbmb86OpfJZRycnh1Gjnl0Aj1ltGa4sNGSMXoY2iNM8NB56LLIp9dztEwExiRSWlWZifpl9ERTIIpHFBq6L2lSTRKqXKb0V3McmgwQ1X0_MdNdLAZaLZjSIIcQgBU26T8Z4YBZ39dA; u=511670501221348; Hm_lvt_1db88642e346389874251b5a1eded6e3=1667994737,1670480781,1670501222; Hm_lpvt_1db88642e346389874251b5a1eded6e3=1670501922', # 防盜鏈 'referer: https://xueqiu.com/hq' # 瀏覽器的基本資訊 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/108.0.0.0 Safari/537.36' } url = 'https://stock.xueqiu.com/v5/stock/screener/quote/list.json?page={page}&size=30&order=desc&orderby=percent&order_by=percent&market=CN&type=sh_sz' # 1. 發送請求 response = requests.get(url=url, headers=headers) print(response.json())

2、獲取資料
什么是json資料?
以 {}/[] 所包裹起來的資料 {“”:“”, “”:“”}
除了 .json 還可以通過 .text 和 .content 來拿到資料,但是它們獲取到的資料是一樣,
.text 獲取到的是字串,文本內容,
.content 取到的是二進制資料,一般是圖片/音頻/視頻內容,
json_data = https://www.cnblogs.com/hahaa/archive/2023/01/06/response.json()
3、決議資料
決議資料就是提取資料,把我們想要的資料提取出來,
沒學過字典的小伙伴,可以先學一下字典,
data_list = json_data['data']['list'] # data_list[0] # data_list[1] for i in range(0, len(data_list)): symbol = data_list[i]['symbol'] name = data_list[i]['name'] current = data_list[i]['current'] chg = data_list[i]['chg'] percent = data_list[i]['percent'] current_year_percent = data_list[i]['current_year_percent'] volume = data_list[i]['volume'] amount = data_list[i]['amount'] turnover_rate = data_list[i]['turnover_rate'] pe_ttm = data_list[i]['pe_ttm'] dividend_yield = data_list[i]['dividend_yield'] market_capital = data_list[i]['market_capital'] print(symbol, name, current, chg, percent, current_year_percent, volume, amount, turnover_rate, pe_ttm, dividend_yield, market_capital)
4、保存資料
csv_writer.writerow([symbol, name, current, chg, percent, current_year_percent, volume, amount, turnover_rate, pe_ttm, dividend_yield, market_capital])
爬蟲部分就結束了,接下來看資料分析部分,文章不理解,我還錄了視頻講解,視頻以及完整代碼在文末名片自取即可,
資料可視化分析
匯入需要使用的模塊
import pandas as pd # 做表格資料處理模塊 from pyecharts.charts import Bar # 可視化模塊 from pyecharts import options as opts # 可視化模塊里面的設定模塊(圖表樣式)
讀取資料
df = pd.read_csv('股票.csv') x = list(df['股票名稱'].values) y = list(df['成交量'].values) c = ( Bar() .add_xaxis(x[:10]) .add_yaxis("成交額", y[:10]) .set_global_opts( xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=-15)), title_opts=opts.TitleOpts(title="Bar-旋轉X軸標簽", subtitle="解決標簽名字過長的問題"), ) .render("成交量圖表.html")
最后
今天的分享到這里就結束了,如果如果覺得有幫助的話,記得點贊收藏哈~
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/541341.html
標籤:其他
