NumPy-有解無憂

認識NumPy

NumPy是Python的一個科學計算庫，用于快速處理大型矩陣，可以看做是打開人工智能的一把鑰匙，

在Python中本身提供的有list結構，但是list中的元素可以是任何物件，就會導致list中保存的是物件的指標，進行運算的時候就得去做記憶體尋址，型別檢測等事情，顯然會浪費比較多的記憶體和CPU資源，在大資料的環境下，list結構難以勝任，

NumPy的很多底層函式都是用C語言撰寫，所以運行速度是普通Python代碼無法相比的，

注：NumPy中的陣列型別名叫anarray，在本文中一般直接稱作矩陣或陣列，

安裝

pip3 install numpy

import numpy as np
print(np.__version__)

列印結果：

1.19.2

注：匯入的numpy模塊一般都會命名為np，因此在本文中只要出現np.xxx 指的都是numpy模塊中的xxx函式或屬性，

創建矩陣

基本創建

轉化生成

創建矩陣使用np.array方法進行創建，可傳入串列、元組、字典，將傳入的物件轉化為矩陣，

也可以指定存盤的資料型別dtype，不指定dtype的話默認會自動判斷型別，dtype一般有有符號整數int8、int16、int32，無符號整數unit8、unit16、unit32、浮點數float16、float32、float64，布林值bool，復數complex、complex64、complex128，

list1 = [0,1,2,3,4]
arr1 = np.array(list1)
print(arr1)
print(f'矩陣的物件型別：{type(arr1)}')
print(f'矩陣的資料型別：{arr1.dtype}')
print(f'矩陣的元素總數：{arr1.size}')
print(f'矩陣的維數：{arr1.ndim}')
print(f'矩陣的形狀：{arr1.shape}')

列印結果：

[0 1 2 3 4]
矩陣的物件型別：<class 'numpy.ndarray'>
矩陣的資料型別：int32
矩陣的元素總數：5
矩陣的維數：1
矩陣的形狀：(5,)
列印的形狀代表這是有5個元素的一維矩陣，

list2 = [[0,1,2,3,4],[5,6,7,8,9]]
arr2 = np.array(list2)
print(arr2)
print(f'矩陣的物件型別：{type(arr2)}')
print(f'矩陣的資料型別：{arr2.dtype}')
print(f'矩陣的元素總數：{arr2.size}')
print(f'矩陣的維數：{arr2.ndim}')
print(f'矩陣的形狀：{arr2.shape}')

列印結果：

[[0 1 2 3 4]
[5 6 7 8 9]]
矩陣的物件型別：<class 'numpy.ndarray'>
矩陣的資料型別：int32
矩陣的元素總數：10
矩陣的維數：2
矩陣的形狀：(2, 5)

列印的形狀代表這是一個2行5列的矩陣，

指定存盤的資料型別可以傳入dtype引數：np.array([2,3,4],dtype=np.int64)

創建連續值的矩陣

與Python的range函式相同，NumPy也提供了arange函式，用來創建連續值的矩陣，但是是一維矩陣，

np.arange([start,] stop[, step,], dtype=None)

如果start和stop都指定，那么生成的值為左閉右開區間

arr = np.arange(0,10)
print(arr)

列印結果：

[0 1 2 3 4 5 6 7 8 9]

如果只指定一個引數，那么即為stop，默認start為0

arr = np.arange(10)
print(arr)

列印結果：

[0 1 2 3 4 5 6 7 8 9]

如果傳入三個引數，那么第三個為步長

arr = np.arange(0,10,2)
print(arr)

列印結果：

[0 2 4 6 8]

如果不想傳入start也要指定步長

arr = np.arange(10,step=2)
print(arr)

列印結果：

[0 2 4 6 8]

等引數列與等比數列

等引數列：np.linspace(start,stop,num=50,endpoint=True,retstep=False,dtype=None)

start：起始值
stop：結束值
num：生成數列個數，默認是50個
endpoint：如果為True，則最后一個元素包含在序列中，默認為True
retstep：如果為True，則回傳等差間距，默認False
dtype：資料型別，自動推斷，一般都會是浮點數

創建1-10之間12個等引數列

arr = np.linspace(1,10,12)
print(arr)

列印結果：

[ 1. 1.81818182 2.63636364 3.45454545 4.27272727 5.09090909
5.90909091 6.72727273 7.54545455 8.36363636 9.18181818 10. ]

等比數列：np.logspace(start,stop,num=50,endpoint=True,base=10.0,dtype=None)

start：基底的start次冪
stop：基底的stop次冪
num：生成數列個數，默認是50個
endpoint：如果為True，則最后一個元素包含在序列中，默認為True
base：基底，默認以10為底
dtype：資料型別，自動推斷，一般都會是浮點數

創建基底的1次方到基底的3次方的3個等比數列

arr = np.logspace(1,3,3)
print(arr)

列印結果：

[ 10. 100. 1000.]

創建基底的1次方到基底的10次方的10個等比數列，設基底為2

arr = np.logspace(1,10,10,base=2)
print(arr)

列印結果：

[ 2. 4. 8. 16. 32. 64. 128. 256. 512. 1024.]

創建特定形狀的矩陣

全0矩陣

創建3行4列的全0矩陣

arr = np.zeros((3,4))
print(arr)

列印結果：

[[0. 0. 0. 0.]
[0. 0. 0. 0.]
[0. 0. 0. 0.]]

全1矩陣

創建3行4列的全1矩陣

arr = np.ones((3,4))
print(arr)

列印結果：

[[1. 1. 1. 1.]
[1. 1. 1. 1.]
[1. 1. 1. 1.]]

空矩陣

創建3行4列的空矩陣

arr = np.empty((3,4))
print(arr)

列印結果：

[[1.91409885e-233 1.78018403e-306 6.23057349e-307 1.06811422e-306]
[1.24610383e-306 1.69118108e-306 8.06632139e-308 1.20160711e-306]
[1.69119330e-306 1.29062229e-306 1.29060531e-306 2.16443571e-312]]

空矩陣中的元素內容并不為空，而是未經初始化的垃圾值，也就是隨機產生的資料，

元素值相同的矩陣

創建3行4列元素值為9的矩陣

arr = np.full((3,4),9)
print(arr)

列印結果：

[[9 9 9 9]
[9 9 9 9]
[9 9 9 9]]

仿維度創建矩陣

不管是zeros()，ones()，empty()，full()，都提供得有仿維度創建矩陣的函式，分別為zeros_like()，ones_like()，empty_like()，full_like()，用于創建出與其他矩陣相同維度的矩陣，

list2 = [[0,1,2,3,4],[5,6,7,8,9]]
arr = np.zeros_like(list2)
print(arr)

列印結果：

[[0 0 0 0 0]
[0 0 0 0 0]]

單位矩陣

生成4行4列的單位矩陣

arr = np.eye(4)
print(arr)

列印結果：

[[1. 0. 0. 0.]
[0. 1. 0. 0.]
[0. 0. 1. 0.]
[0. 0. 0. 1.]]

對角矩陣

生成對角元素為1、2、3、4的對角矩陣

arr = np.diag([1,2,3,4])
print(arr)

列印結果：

[[1 0 0 0]
 [0 2 0 0]
 [0 0 3 0]
 [0 0 0 4]]

創建隨機矩陣

生成0-1的亂數矩陣

生成0到1之間的3行3列隨機矩陣

arr = np.random.random((3,3))
print(arr)

列印結果：

[[0.17461969 0.95103848 0.90655296]
[0.43783401 0.86078027 0.21500809]
[0.41657465 0.74977705 0.94805408]]

生成均勻分布的亂數

生成一個1-3之間的亂數

arr = np.random.uniform(1,3)
print(arr)

列印結果：

1.719737091794529

生成12個1-3之間均勻分布的亂數

arr = np.random.uniform(1,3,12)
print(arr)

列印結果：

[1.61483448 1.9048385 1.13600459 1.45937536 2.94301615 2.57079044
1.51789902 2.36870025 1.53805667 1.77119578 1.14710285 1.28136849]

生成一個3行3列的1-3之間均勻分布的亂數二維矩陣

arr = np.random.uniform(1,3,(3,3))
print(arr)

列印結果：

[[1.12853188 1.62992154 1.08904213]
[2.3179576 2.80127557 2.59765234]
[2.58337986 2.46281735 1.69915473]]

生成標準正態的亂數

生成一個3行3列的標準正態的亂數二維矩陣

arr = np.random.randn(3,3)
print(arr)

列印結果：

[[-0.6659642  -0.14469211 -1.11157242]
 [-1.02770088  0.35732496 -0.74733868]
 [-2.30185962  0.05385927 -1.27661142]]

生成正態分布的亂數

本函式有3個引數：

第一個為正態分布的均值，也就是正態分布的中心對稱點，
第二個為正態分布的標準差，標準差越大，影像越矮胖，標準差越小，影像越高瘦，
第三個為生成的矩陣形狀，

生成以1為均值2為標準差的3個亂數

arr = np.random.normal(1,2,3)
print(arr)

列印結果：

[0.13655215 4.1985189 2.63631302]

生成以1為均值3為標準差的3行3列的亂數矩陣

arr = np.random.normal(1,2,(3,3))
print(arr)

列印結果：

[[-0.94984175 0.9797389 -1.9574591 ]
[ 1.68702742 -0.1447021 0.80012014]
[-0.40085419 -1.56918216 -0.45392184]]

生成隨機整數

生成3行3列0-10之間的隨機整數矩陣

arr = np.random.randint(0,10,(3,3))
print(arr)

列印結果：

[[7 3 1]
[0 3 0]
[3 6 1]]

矩陣一般操作

矩陣截取

矩陣截取實際上就是融合了索引機制與切片機制，與list結構的截取用法一樣，

生成一個5行5列的矩陣，作為本小節操作源，

np.random.seed(0) #設定亂數種子 讓每次生成的亂數都相同 方便測驗
arr = np.random.randint(0,10,(5,5))
print(arr)

列印結果：

[[5 0 3 3 7]
[9 3 5 2 4]
[7 6 8 8 1]
[6 7 7 8 1]
[5 9 8 9 4]]

截取矩陣第1行

a = arr[0]
print(a)

列印結果：

[5 0 3 3 7]

截取矩陣最后一行

a = arr[-1]
print(a)

列印結果：

[5 9 8 9 4]

截取矩陣最后兩行

a = arr[-2:]
print(a)

列印結果：

[[6 7 7 8 1]
[5 9 8 9 4]]

整個矩陣隔行截取

a = arr[0::2]
print(a)

列印結果：

[[5 0 3 3 7]
[7 6 8 8 1]
[5 9 8 9 4]]

截取矩陣第2行的第3列

a = arr[1,2]
print(a)

列印結果：

截取矩陣前兩列

a = arr[:,0:2]
print(a)

列印結果：

[[5 0]
[9 3]
[7 6]
[6 7]
[5 9]]

按條件截取

依然生成一個5行5列的矩陣，作為本小節操作源，

np.random.seed(0) #設定亂數種子 讓每次生成的亂數都相同 方便測驗
arr = np.random.randint(0,10,(5,5))
print(arr)

列印結果：

[[5 0 3 3 7]
[9 3 5 2 4]
[7 6 8 8 1]
[6 7 7 8 1]
[5 9 8 9 4]]

以大于5為條件轉布林值矩陣

a = arr > 5
print(a)

列印結果：

[[False False False False True]
[ True False False False False]
[ True True True True False]
[ True True True True False]
[False True True True False]]

找出所有大于5的數

a = arr[arr > 5]
print(a)

列印結果：

[7 9 7 6 8 8 6 7 7 8 9 8 9]

矩陣中小于等于5的值置為0，其他不變

arr[arr <= 5] = 0
print(arr)

列印結果：

[[0 0 0 0 7]
[9 0 0 0 0]
[7 6 8 8 0]
[6 7 7 8 0]
[0 9 8 9 0]]

矩陣合并

生成兩個一樣的矩陣，作為本小節的示例源，

np.random.seed(0)
arr1 = arr2 = np.random.randint(0,10,(2,2))
print(arr1)

列印結果：

[[5 0]
[3 3]]

矩陣拉直合并

arr3 = np.append(arr1,arr2)
print(arr3)

列印結果：

[5 0 3 3 5 0 3 3]

矩陣橫向合并

arr3 = np.hstack([arr1,arr2])
print(arr3)

列印結果：

[[5 0 5 0]
[3 3 3 3]]

矩陣縱向合并

arr3 = np.vstack([arr1,arr2])
print(arr3)

列印結果：

[[5 0]
[3 3]
[5 0]
[3 3]]

矩陣運算

普通運算

普通運算有如下幾種：

加法 + 矩陣各元素對應相加
減法 - 矩陣各元素對應相減
乘法 * 矩陣各元素對應相乘
除法 / 矩陣各元素對應相除
取余 % 矩陣各元素對應相除后取余
冪運算 ** 矩陣各元素對應冪運算

創建一個3行3列的矩陣，用來作為本小節的操作源，

np.random.seed(0)
arr1 = np.random.randint(0,10,(3,3))
print(arr1)

列印結果：

[[5 0 3]
[3 7 9]
[3 5 2]]

加法

arr2 = arr1 + 10
print(arr2)

列印結果：

[[15 10 13]
[13 17 19]
[13 15 12]]

平方

arr2 = arr1 ** 2
print(arr2)

列印結果：

[[25 0 9]
[ 9 49 81]
[ 9 25 4]]

矩陣乘法

矩陣乘法要滿足矩陣乘法的條件：第一個矩陣的列數要等于第二個矩陣的行數才可以進行乘法計算

計算規則是，第一個矩陣的每行的每個數字與第二個矩陣的每列的每個數字對應相乘再相加，計算結果是第一個矩陣的行數第二個矩陣的列數所對應的值，

比如矩陣A：

2 3
4 5

矩陣B：

1 2
3 4

AB兩矩陣相乘，得到新矩陣C

C11：2*1 + 3*3 = 11
C12：2*2 + 3*4 = 16
C21：4*1 + 5*3 = 19
C22：4*2 + 5*4 = 28

也就是：

11 16
19 28

arr1 = np.array([[2,3],[4,5]])
print(arr1)

arr2 = np.array([[1,2],[3,4]])
print(arr2)

arr3 = np.dot(arr1,arr2)
print(arr3)

列印結果：

[[2 3]
 [4 5]]
[[1 2]
 [3 4]]
[[11 16]
 [19 28]]

矩陣轉置

np.transpose和arr.T效果相同，只適用于一維矩陣和二維矩陣，

arr = np.random.randint(1,10,(3,3))
print(arr)
print(np.transpose(arr))
print(arr.T)

列印結果：

[[9 7 5]
[1 9 6]
[3 3 4]]
[[9 1 3]
[7 9 3]
[5 6 4]]
[[9 1 3]
[7 9 3]
[5 6 4]]

最大最小值

最大值函式為np.amax()，最小值函式為np.amin()，使用方法一模一樣，再次只演示最大值，

求矩陣最大值

arr = np.array([[0,1,2,3,4],[5,6,7,8,9]])
print(arr)
print(np.amax(arr))

列印結果：

[[0 1 2 3 4]
[5 6 7 8 9]]
9

求每行的最大值

arr = np.array([[0,1,2,3,4],[5,6,7,8,9]])
print(arr)
print(np.amax(arr,axis=1))

列印結果：

[[0 1 2 3 4]
[5 6 7 8 9]]
[4 9]

求每列的最大值

arr = np.array([[0,1,2,3,4],[5,6,7,8,9]])
print(arr)
print(np.amax(arr,axis=0))

列印結果：

[[0 1 2 3 4]
[5 6 7 8 9]]
[5 6 7 8 9]

計算均值

arr = np.array([[0,1,2,3,4],[5,6,7,8,9]])
print(arr)
print(np.mean(arr))

列印結果：

[[0 1 2 3 4]
[5 6 7 8 9]]
4.5

計算中位數

arr = np.array([[0,1,2,3,4],[5,6,7,8,9]])
print(arr)
print(np.median(arr))

列印結果：

[[0 1 2 3 4]
[5 6 7 8 9]]
4.5

計算標準差

arr = np.array([[0,1,2,3,4],[5,6,7,8,9]])
print(arr)
print(np.std(arr))

列印結果：

[[0 1 2 3 4]
[5 6 7 8 9]]
2.8722813232690143

計算方差

arr = np.array([[0,1,2,3,4],[5,6,7,8,9]])
print(arr)
print(np.var(arr))

列印結果：

[[0 1 2 3 4]
[5 6 7 8 9]]
8.25

持久化存盤

保存為二進制檔案

arr = np.array([[0,1,2,3,4],[5,6,7,8,9]])
np.save('binary',arr)

z = np.load('binary.npy')
print(z)

列印結果：

[[0 1 2 3 4]
[5 6 7 8 9]]

np.save方法如果指定的檔案名不是.npy后綴的話，會自動追加.npy后綴，
np.save方法可以保存任何維度的矩陣，

保存為txt檔案

arr = np.array([[0,1,2,3,4],[5,6,7,8,9]])
np.savetxt('a.txt',arr,fmt="%d")

z = np.loadtxt('a.txt')
print(z)

列印結果：

[[0. 1. 2. 3. 4.]
[5. 6. 7. 8. 9.]]

np.savetxt方法只能保存一維或二維矩陣，
np.savetxt方法的fmt引數需要指定存盤資料格式，不指定的話默認是保留18位小數點的浮點數，存盤整數用fmt="%d"，保留4位小數點用fmt="%0.4f"，保存字串用fmt='%s'，
np.savetxt方法還可以傳入header引數和footer引數，用于添加檔案頭部和尾部的注釋資訊，
np.loadtxt方法讀取檔案默認接收為浮點數格式，可以使用dtype引數指定格式，

保存為csv檔案

arr = np.array([[0,1,2,3,4],[5,6,7,8,9]])
np.savetxt('a.csv',arr,fmt="%d",delimiter=',')

z = np.loadtxt('a.csv',delimiter=',')
print(z)

列印結果：

[[0. 1. 2. 3. 4.]
[5. 6. 7. 8. 9.]]

保存為csv檔案依然還是使用np.savetxt方法，只不過添加一個delimiter引數，指明每個資料之間以逗號分隔，

轉載請註明出處，本文鏈接：https://www.uj5u.com/houduan/182727.html

標籤：Python

上一篇：大量類加載器創建導致詭異FullGC

下一篇：python多執行緒爬取壁紙