主頁 > 後端開發 > Python資料分析--Numpy常用函式介紹(3)

Python資料分析--Numpy常用函式介紹(3)

2022-05-27 17:26:50 後端開發

摘要:先匯總相關股票價格,然后有選擇地對其分類,再計算移動均線、布林線等,

一、匯總資料

匯總整個交易周中從周一到周五的所有資料(包括日期、開盤價、最高價、最低價、收盤價,成交量等),由于我們的資料是從2020年8月24日開始匯出,資料多達420條,先截取部分時間段的資料,不妨先讀取開始20個交易日的價格,代碼如下:

import numpy as np
from datetime import datetime

def datestr2num(s): #定義一個函式
    return datetime.strptime(s.decode('ascii'),"%Y-%m-%d").date().weekday()
#decode('ascii') 將字串s轉化為ascii碼

#讀取csv檔案 ,將日期、開盤價、最低價、最高價、收盤價、成交量等全部讀取
dates, opens, high, low, close,vol=np.loadtxt('data.csv',delimiter=',', usecols=(1,2,3,4,5,6),converters={1:datestr2num},unpack=True) #按順序對應好data.csv與usecols=(1,2,3,4,5,6)中的列
#獲取20個交易日的資料 
closes = close[0:20] #實際存取下標是0-19
dateslist = dates[0:20]
print(closes) #列印出closes數列
print(dateslist)

這樣就把data.csv中對應的日期、開盤價、最高價、最低價、收盤價,成交量等分別存入到dates, opens, high, low, close,vol中,由于后面示例只統計20個交易日資料,所以closes = close[0:20] ,即截取close中前20個資料,

運行結果:

[37.5  37.58 37.23 36.9  38.45 37.69 37.42 37.2  36.98 36.8  36.79 37.59 37.6  37.7  37.24 37.35 37.9  38.06 37.87 38.99]
[0. 1. 2. 3. 4. 0. 1. 2. 3. 4. 0. 1. 2. 3. 4. 0. 1. 2. 3. 4.]

即20個交易日的收盤價和所屬的星期(0表示周一、4表示周五),

分別看一下最開始周一的下標和最后一個周五的下標

first_monday = np.ravel(np.where(dateslist == 0))[0]
print ("The first Monday index is", first_monday)
#回傳最后一個周五的位置
last_friday = np.ravel(np.where(dateslist == 4))[-1]
print ("The last Friday index is", last_friday)
print('\n')

運行結果:

The first Monday index is 0
The last Friday index is 19

定義一個陣列,用于存盤20個交易日的索引值

weeks_indices = np.arange(first_monday, last_friday+1)
print ("Weeks indices initial", weeks_indices)

按5個交易日,分成4周,對20個交易日分成4周:

weeks_indices = np.split(weeks_indices,4)
print("Weeks indices after split", weeks_indices)
Weeks indices initial [ 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19]
Weeks indices after split [array([0, 1, 2, 3, 4], dtype=int64), array([5, 6, 7, 8, 9], dtype=int64), array([10, 11, 12, 13, 14], dtype=int64), array([15, 16, 17, 18, 19], dtype=int64)]

 NumPy中,陣列的維度也被稱作軸,apply_along_axis 函式會呼叫另外一個由我們給出的函式,作用于每一個陣列元素上,陣列中有4個元素,分別對應于示例資料中的4個星期,元素中的索引值對應于示例資料中的1天,在呼叫apply_along_axis 時提供我們自定義的函式名summarize,并指定要作用的軸或維度的編號(如取1)、目標陣列以及可變數量的summarize函式的引數,同時進行保存,

# 定義一個函式,該函式將為每一周的資料回傳一個元組,包含這一周的開盤價、最高價、最低價和收盤價,類似于每天的盤后資料
def summarize(a, o, h, l, c):
monday_open = o[a[0]] #周一開盤價
    week_high = np.max( np.take(h, a) ) # 某周最高價
    week_low = np.min( np.take(l, a) )  # 某周最低價
    friday_close = c[a[-1]]      #某周的收盤價
    
    return("招商銀行", monday_open, week_high, week_low, friday_close) #回傳某周開盤、最高、低價、收盤價

weeksummary = np.apply_along_axis(summarize, 1, weeks_indices,opens, high, low, close)
print ("Week summary", weeksummary)

np.savetxt("weeksummary.csv", weeksummary, delimiter=",", fmt="%s")

實際運行如下:

二、均線

1、波動幅度均值(ATR)
ATR(Average True Range,真實波動幅度均值)是一個用來衡量股價波動性的技術指標,ATR是基于N個交易日的最高價和最低價進行計算的,通常取最近20個交易日,

(1) 前一個交易日的收盤價, previousclose = c[-N -1: -1]
對于每一個交易日,計算以下各項,
h – l 當日最高價和最低價之差,   h – previousclose 當日最高價和前一個交易日收盤價之差,         previousclose – l 前一個交易日收盤價和當日最低價之差,

(2) 用NumPy中的 maximum 函式回傳上述三個中的最大值,    truerange = np.maximum(h - l, h - previousclose, previousclose - l)

(3) 創建一個長度為 N 的陣列 atr ,并初始化陣列元素為0,atr = np.zeros(N)

(4) 這個陣列的首個元素就是 truerange 陣列元素的平均值,atr[0] = np.mean(truerange)
5)計算出每個交易日的波動幅度:

for i in range(1, N):
atr[i] = (N - 1) * atr[i - 1] + truerange[i]
atr[i] /= N

示例代碼如下:

import numpy as np
from datetime import datetime

def datestr2num(s): #定義一個函式
    return datetime.strptime(s.decode('ascii'),"%Y-%m-%d").date().weekday()

dates, opens, high, low, close,vol=np.loadtxt('data.csv',delimiter=',', usecols=(1,2,3,4,5,6),
                       converters={1:datestr2num},unpack=True)
closes = close[0:20]  #實際存取下標是0-19
dateslist = dates[0:20]
first_monday = np.ravel(np.where(dateslist == 0))[0]
last_friday = np.ravel(np.where(dateslist == 4))[-1]#從最后一個位置開始
weeks_indices = np.split(np.arange(first_monday, last_friday+1),4)

#波動幅度均值(ATR)
N = 20
h = high[-N:]
l = low[-N:]

print ("len(high)", len(h), "len(low)", len(l))
#print ("Close", close)
#前一日的收盤價數列
previousclose = close[-N-1: -1]
print ("len(previousclose)", len(previousclose))
print ("Previous close", previousclose)

#用NumPy中的maximum函式,在 最高-最低,最高-昨日收盤,昨日收盤 三個資料選擇最大
truerange = np.maximum(h-l,h-previousclose,previousclose) 
print ("True range", truerange)

atr = np.zeros(N)  # 創建一個長度為 N 的陣列 atr ,并初始化陣列元素為0
atr[0] = np.mean(truerange) # 陣列的首個元素設定為truerange陣列元素的平均值
for i in range(1, N):  #回圈,計算每個交易日的波幅,并保存
    atr[i] = (N - 1) * atr[i - 1] + truerange[i] 
    atr[i] /= N
print ("ATR", atr)

運行結果:

len(high) 20 len(low) 20
len(previousclose) 20
Previous close [42.1  41.1  41.28 42.5  38.83 38.41 38.04 39.62 39.93 39.26 37.91 36.47 36.98 37.21 36.61 37.15 36.89 38.6  38.5  38.03]
True range [1.08 1.5  2.32 2.23 1.56 1.02 2.13 1.49 1.16 0.85 1.67 1.9  0.96 0.63 0.99 0.69 1.74 1.18 0.73 2.15]
ATR [1.399      1.40405    1.4498475  1.48885513 1.49241237 1.46879175 1.50185216 1.50125955 1.48419658 1.45248675 1.46336241 
1.48519429 1.45893458 1.41748785 1.39611345 1.36080778 1.37976739 1.36977902 1.33779007 1.37840057]

2、移動均線:股市中最常見的是指標,移動平均線只需要少量的回圈和均值函式即可計算得出,簡單移動平均線是計算與等權重的指示函式的卷積,

簡單移動平均線(simple moving average)通常用于分析時間序列上的資料,我們按照時間序列,并N個周期資料的均值,

(1) 使用 ones 函式創建一個長度為 N 的元素均初始化為1的陣列,然后對整個陣列除以 N ,即可得到權重,比如 5日均線,即N=5,則平均每天的權重都為0.2.

N = 5
weights = np.ones(N) / N
print ("Weights", weights)

(2)使用 convolve 函式呼叫上述的權重值

sma = np.convolve(weights, c)[N-1:-N+1]

從 convolve 函式回傳的陣列中,取出中間的長度為N的部分,下面的代碼將創建  一個存盤時間值的陣列

N = 5
weights = np.ones(N) / N
print ("Weights", weights)

sma = np.convolve(weights, close)[N-1:-N+1]
print(sma)
print(len(sma))

運行結果如下,可以看到,匯出的420個資料,通過計算,得到的均線陣列有416個,

很明顯sma是一個數列,用前期matplotlib中的函式,可以繪制畫面,增加如下代碼:

import matplotlib.pyplot as plt
#省略上述代碼

plt.plot(sma, linewidth=5)

運行結果如下:

 

3、指數移動平均線

指數移動平均線(exponential moving average)是另一種技術指標,指數移動平均線使用的權重是指數衰減的,對歷史資料點賦予的權重以指數速度減小,但不會到達0,在計算權重的程序中使用 exp 和 linspace 函式,

1)先了解numpy中的exp 和 linspace 函式

x = np.arange(5)
y = np.arange(10)
print ("Exp", np.exp(x)) # exp 函式可以計算出每個陣列元素的指數
print ("Exp", np.exp(y)) 

運行結果:

ExpX [ 1.          2.71828183  7.3890561  20.08553692 54.59815003]
ExpY [1.00000000e+00 2.71828183e+00 7.38905610e+00 2.00855369e+01 5.45981500e+01 1.48413159e+02 4.03428793e+02 1.09663316e+03 2.98095799e+03 8.10308393e+03]

可以看出,exp()函式接受一個數列,計算出每個陣列元素的指數,

print( "Linspace", np.linspace(-1, 0, 5))

運行結果:

Linspace [-1.   -0.75 -0.5  -0.25  0.  ]

linspace中有三個引數,其中前2個是一個范圍:一個起始值和一個終止值引數,后一個是生成的陣列元素的個數,

2)計算指數移動平均線

利用上述兩個函式對權重進行計算:weights = np.exp(np.linspace(-1. , 0. , N))

全部代碼如下:

import numpy as np
from datetime import datetime
import matplotlib.pyplot as plt

def datestr2num(s): #定義一個函式
    return datetime.strptime(s.decode('ascii'),"%Y-%m-%d").date().weekday()

dates, opens, high, low, close,vol=np.loadtxt('data.csv',delimiter=',', usecols=(1,2,3,4,5,6),
                       converters={1:datestr2num},unpack=True)

N = 5
"""
weights = np.ones(N) / N
print ("Weights", weights)
sma = np.convolve(weights, close)[N-1:-N+1]
print(sma)
print(len(sma))
plt.plot(sma, linewidth=5)
"""
weights = np.exp(np.linspace(-1., 0., N)) # 
weights /= weights.sum()  #對權重值做歸一化處理
print( "Weights", weights)
ema = np.convolve(weights, close)[N-1:-N+1]
#print(ema)

t = np.arange(N - 1, len(close))
plt.plot (t, close[N-1:], lw=1.0)  #收盤價繪制曲線圖
plt.plot (t, ema, lw=2.0)   #按權重計算均線曲線圖
plt.show()

運行結果:

4、繪制布林帶

布林帶,是一個N個周期移動均線,和2倍的N周期標準差與移動均線形成的上、下形成的三條曲線,

上軌道: ema+2*np.std(close) (當然,ema也可以換成上述的sma,也可以換成close等)

移動均線:ema

下軌道: ema-2*np.std(close) 

完整代碼:

import numpy as np
from datetime import datetime
import matplotlib.pyplot as plt

def datestr2num(s): #定義一個函式
    return datetime.strptime(s.decode('ascii'),"%Y-%m-%d").date().weekday()

dates, opens, high, low, close,vol=np.loadtxt('data.csv',delimiter=',', usecols=(1,2,3,4,5,6),
                       converters={1:datestr2num},unpack=True)

N = 5
weights = np.ones(N) / N
sma = np.convolve(weights, close)[N-1:-N+1]
deviation = []

clegth = len(close)
for i in range(N - 1, clegth ):
    if i + N < clegth :
        dev = close [i: i + N]
    else:
        dev = close [-N:]
    
    averages = np.zeros(N)
    averages.fill(sma[i - N - 1]) #fill()函式可以用一個指定的標量值填充陣列,而這個標量值也是 fill 函式唯一的引數,
    dev = dev - averages
    dev = dev ** 2
    dev = np.sqrt(np.mean(dev))
    deviation.append(dev) 

deviation = 2 * np.array(deviation)
upperBB = sma + deviation
lowerBB = sma - deviation

c_slice = close[N-1:]
between_bands = np.where((c_slice < upperBB) & (c_slice > lowerBB))
between_bands = len(np.ravel(between_bands))
print( "Ratio between bands", float(between_bands)/len(c_slice))

t = np.arange(N-1,clegth)
plt.plot(t, c_slice, lw=1.0) #收盤價
plt.plot(t, sma, lw=2.0)     #移動均線
plt.plot(t, upperBB, lw=3.0) #上軌道
plt.plot(t, lowerBB, lw=1.0) #下軌道
plt.show()

運行結果:

轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/481295.html

標籤:Python

上一篇:shiro中常用的物件和方法

下一篇:Python寫實用小工具-實作圖片轉字符畫

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 【C++】Microsoft C++、C 和匯編程式檔案

    ......

    uj5u.com 2020-09-10 00:57:23 more
  • 例外宣告

    相比于斷言適用于排除邏輯上不可能存在的狀態,例外通常是用于邏輯上可能發生的錯誤。 例外宣告 Item 1:當函式不可能拋出例外或不能接受拋出例外時,使用noexcept 理由 如果不打算拋出例外的話,程式就會認為無法處理這種錯誤,并且應當盡早終止,如此可以有效地阻止例外的傳播與擴散。 示例 //不可 ......

    uj5u.com 2020-09-10 00:57:27 more
  • Codeforces 1400E Clear the Multiset(貪心 + 分治)

    鏈接:https://codeforces.com/problemset/problem/1400/E 來源:Codeforces 思路:給你一個陣列,現在你可以進行兩種操作,操作1:將一段沒有 0 的區間進行減一的操作,操作2:將 i 位置上的元素歸零。最終問:將這個陣列的全部元素歸零后操作的最少 ......

    uj5u.com 2020-09-10 00:57:30 more
  • UVA11610 【Reverse Prime】

    本人看到此題沒有翻譯,就附帶了一個自己的翻譯版本 思考 這一題,它的第一個要求是找出所有 $7$ 位反向質數及其質因數的個數。 我們應該需要質數篩篩選1~$10^{7}$的所有數,這里就不慢慢介紹了。但是,重讀題,我們突然發現反向質數都是 $7$ 位,而將它反過來后的數字卻是 $6$ 位數,這就說明 ......

    uj5u.com 2020-09-10 00:57:36 more
  • 統計區間素數數量

    1 #pragma GCC optimize(2) 2 #include <bits/stdc++.h> 3 using namespace std; 4 bool isprime[1000000010]; 5 vector<int> prime; 6 inline int getlist(int ......

    uj5u.com 2020-09-10 00:57:47 more
  • C/C++編程筆記:C++中的 const 變數詳解,教你正確認識const用法

    1、C中的const 1、區域const變數存放在堆疊區中,會分配記憶體(也就是說可以通過地址間接修改變數的值)。測驗代碼如下: 運行結果: 2、全域const變數存放在只讀資料段(不能通過地址修改,會發生寫入錯誤), 默認為外部聯編,可以給其他源檔案使用(需要用extern關鍵字修飾) 運行結果: ......

    uj5u.com 2020-09-10 00:58:04 more
  • 【C++犯錯記錄】VS2019 MFC添加資源不懂如何修改資源宏ID

    1. 首先在資源視圖中,添加資源 2. 點擊新添加的資源,復制自動生成的ID 3. 在解決方案資源管理器中找到Resource.h檔案,編輯,使用整個專案搜索和替換的方式快速替換 宏宣告 4. Ctrl+Shift+F 全域搜索,點擊查找全部,然后逐個替換 5. 為什么使用搜索替換而不使用屬性視窗直 ......

    uj5u.com 2020-09-10 00:59:11 more
  • 【C++犯錯記錄】VS2019 MFC不懂的批量添加資源

    1. 打開資源頭檔案Resource.h,在其中預先定義好宏 ID(不清楚其實ID值應該設定多少,可以先新建一個相同的資源項,再在這個資源的ID值的基礎上遞增即可) 2. 在資源視圖中選中專案資源,按F7編輯資源檔案,按 ID 型別 相對路徑的形式添加 資源。(別忘了先把檔案拷貝到專案中的res檔案 ......

    uj5u.com 2020-09-10 01:00:19 more
  • C/C++編程筆記:關于C++的參考型別,專供新手入門使用

    今天要講的是C++中我最喜歡的一個用法——參考,也叫別名。 參考就是給一個變數名取一個變數名,方便我們間接地使用這個變數。我們可以給一個變數創建N個參考,這N + 1個變數共享了同一塊記憶體區域。(參考型別的變數會占用記憶體空間,占用的記憶體空間的大小和指標型別的大小是相同的。雖然參考是一個物件的別名,但 ......

    uj5u.com 2020-09-10 01:00:22 more
  • 【C/C++編程筆記】從頭開始學習C ++:初學者完整指南

    眾所周知,C ++的學習曲線陡峭,但是花時間學習這種語言將為您的職業帶來奇跡,并使您與其他開發人員區分開。您會更輕松地學習新語言,形成真正的解決問題的技能,并在編程的基礎上打下堅實的基礎。 C ++將幫助您養成良好的編程習慣(即清晰一致的編碼風格,在撰寫代碼時注釋代碼,并限制類內部的可見性),并且由 ......

    uj5u.com 2020-09-10 01:00:41 more
最新发布
  • Rust中的智能指標:Box<T> Rc<T> Arc<T> Cell<T> RefCell<T> Weak

    Rust中的智能指標是什么 智能指標(smart pointers)是一類資料結構,是擁有資料所有權和額外功能的指標。是指標的進一步發展 指標(pointer)是一個包含記憶體地址的變數的通用概念。這個地址參考,或 ” 指向”(points at)一些其 他資料 。參考以 & 符號為標志并借用了他們所 ......

    uj5u.com 2023-04-20 07:24:10 more
  • Java的值傳遞和參考傳遞

    值傳遞不會改變本身,參考傳遞(如果傳遞的值需要實體化到堆里)如果發生修改了會改變本身。 1.基本資料型別都是值傳遞 package com.example.basic; public class Test { public static void main(String[] args) { int ......

    uj5u.com 2023-04-20 07:24:04 more
  • [2]SpinalHDL教程——Scala簡單入門

    第一個 Scala 程式 shell里面輸入 $ scala scala> 1 + 1 res0: Int = 2 scala> println("Hello World!") Hello World! 檔案形式 object HelloWorld { /* 這是我的第一個 Scala 程式 * 以 ......

    uj5u.com 2023-04-20 07:23:58 more
  • 理解函式指標和回呼函式

    理解 函式指標 指向函式的指標。比如: 理解函式指標的偽代碼 void (*p)(int type, char *data); // 定義一個函式指標p void func(int type, char *data); // 宣告一個函式func p = func; // 將指標p指向函式func ......

    uj5u.com 2023-04-20 07:23:52 more
  • Django筆記二十五之資料庫函式之日期函式

    本文首發于公眾號:Hunter后端 原文鏈接:Django筆記二十五之資料庫函式之日期函式 日期函式主要介紹兩個大類,Extract() 和 Trunc() Extract() 函式作用是提取日期,比如我們可以提取一個日期欄位的年份,月份,日等資料 Trunc() 的作用則是截取,比如 2022-0 ......

    uj5u.com 2023-04-20 07:23:45 more
  • 一天吃透JVM面試八股文

    什么是JVM? JVM,全稱Java Virtual Machine(Java虛擬機),是通過在實際的計算機上仿真模擬各種計算機功能來實作的。由一套位元組碼指令集、一組暫存器、一個堆疊、一個垃圾回收堆和一個存盤方法域等組成。JVM屏蔽了與作業系統平臺相關的資訊,使得Java程式只需要生成在Java虛擬機 ......

    uj5u.com 2023-04-20 07:23:31 more
  • 使用Java接入小程式訂閱訊息!

    更新完微信服務號的模板訊息之后,我又趕緊把微信小程式的訂閱訊息給實作了!之前我一直以為微信小程式也是要企業才能申請,沒想到小程式個人就能申請。 訊息推送平臺🔥推送下發【郵件】【短信】【微信服務號】【微信小程式】【企業微信】【釘釘】等訊息型別。 https://gitee.com/zhongfuch ......

    uj5u.com 2023-04-20 07:22:59 more
  • java -- 緩沖流、轉換流、序列化流

    緩沖流 緩沖流, 也叫高效流, 按照資料型別分類: 位元組緩沖流:BufferedInputStream,BufferedOutputStream 字符緩沖流:BufferedReader,BufferedWriter 緩沖流的基本原理,是在創建流物件時,會創建一個內置的默認大小的緩沖區陣列,通過緩沖 ......

    uj5u.com 2023-04-20 07:22:49 more
  • Java-SpringBoot-Range請求頭設定實作視頻分段傳輸

    老實說,人太懶了,現在基本都不喜歡寫筆記了,但是網上有關Range請求頭的文章都太水了 下面是抄的一段StackOverflow的代碼...自己大修改過的,寫的注釋挺全的,應該直接看得懂,就不解釋了 寫的不好...只是希望能給視頻網站開發的新手一點點幫助吧. 業務場景:視頻分段傳輸、視頻多段傳輸(理 ......

    uj5u.com 2023-04-20 07:22:42 more
  • Windows 10開發教程_編程入門自學教程_菜鳥教程-免費教程分享

    教程簡介 Windows 10開發入門教程 - 從簡單的步驟了解Windows 10開發,從基本到高級概念,包括簡介,UWP,第一個應用程式,商店,XAML控制元件,資料系結,XAML性能,自適應設計,自適應UI,自適應代碼,檔案管理,SQLite資料庫,應用程式到應用程式通信,應用程式本地化,應用程式 ......

    uj5u.com 2023-04-20 07:22:35 more