介紹
在使用機器學習方法解決問題的程序中,一定會遇到需要針對資料進行繪圖的場景,
Matplotlib 是支持 Python 語言的開源繪圖庫,因為其支持豐富的繪圖型別、簡單的繪圖方式以及完善的介面檔案,深受 Python 工程師、科研學者、資料工程師等各類人士的喜歡
Matplotlib 擁有著十分活躍的社區以及穩定的版本迭代,當我們在學習機器學習的課程時,掌握 Matplotlib 的使用無疑是最重要的準備作業之一
在使用 Notebook 環境繪圖時,需要先運行 Jupyter Notebook 的魔術命令 %matplotlib inline
這條命令的作用是將 Matplotlib 繪制的圖形嵌入在當前頁面中,而在桌面環境中繪圖時,不需要添加此命令,而是在全部繪圖代碼之后追加 plt.show()
簡單圖形繪制
使用 Matplotlib 提供的面向物件 API,需要匯入 pyplot 模塊,并約定簡稱為 plt
快速上手
import matplotlib.pyplot as plt
%matplotlib inline
plt.plot([1, 2, 3, 2, 1, 2, 3, 4, 5, 6, 5, 4, 3, 2, 1])

前面,我們從 Matplotlib 中匯入了 pyplot 繪圖模塊,并將其簡稱為 plt
pyplot 模塊是 Matplotlib 最核心的模塊,幾乎所有樣式的 2D 圖形都是經過該模塊繪制出來的
自定義X/Y軸
plt.plot() 是 pyplot 模塊下面的直線繪制(折線圖)方法類. 示例中包含了一個 [1, 2, 3, 2, 1, 2, 3, 4, 5, 6, 5, 4, 3, 2, 1] 串列,Matplotlib 會默認將該串列作為 y 值,而 x 值會從 0 開始依次遞增,
當然,如果你需要自定義橫坐標值,只需要傳入兩個串列即可
plt.plot([1,2,3],
[1, 2, 3])

圖表實作
匯總
上面演示了如何繪制一個簡單的折線圖
那么,除了折線圖,我們平常還要繪制柱狀圖、散點圖、餅狀圖等等. 這些圖應該怎樣繪制呢?
pyplot 模塊中 pyplot.plot 方法是用來繪制折線圖的
你應該會很容易聯想到,更改后面的方法類名就可以更改圖形的樣式,
的確,在 Matplotlib 中,大部分圖形樣式的繪制方法都存在于 pyplot 模塊中,例如:
| 方法 | 含義 |
|---|---|
matplotlib.pyplot.plot | 折線圖 |
matplotlib.pyplot.angle_spectrum | 電子波譜圖 |
matplotlib.pyplot.bar | 柱狀圖 |
matplotlib.pyplot.barh | 直方圖 |
matplotlib.pyplot.broken_barh | 水平直方圖 |
matplotlib.pyplot.contour | 等高線圖 |
matplotlib.pyplot.errorbar | 誤差線 |
matplotlib.pyplot.hexbin | 六邊形圖案 |
matplotlib.pyplot.hist | 柱形圖 |
matplotlib.pyplot.hist2d | 水平柱狀圖 |
matplotlib.pyplot.pie | 餅狀圖 |
matplotlib.pyplot.quiver | 量場圖 |
matplotlib.pyplot.scatter | 散點圖 |
matplotlib.pyplot.specgram | 光譜圖 |
下面,我們參考折線圖的繪制方法,嘗試繪制幾個簡單的圖形,
正弦曲線圖
matplotlib.pyplot.plot(*args, **kwargs) 方法嚴格來講可以繪制線形圖或者樣本標記
其中,*args 允許輸入單個 y 值或 x,y 值
例如,我們這里繪制一張自定義 x,y 的正弦曲線圖
import numpy as np
# 在 -2PI 和 2PI 之間等間距生成 1000 個值,也就是 X 坐標
X = np.linspace(-2*np.pi, 2*np.pi, 1000)
# 計算 y 坐標
y = np.sin(X)
# 向方法中 `*args` 輸入 X,y 坐標
plt.plot(X, y)

正弦曲線就繪制出來了,但值得注意的是,pyplot.plot 在這里繪制的正弦曲線,實際上不是嚴格意義上的曲線圖,而在兩點之間依舊是直線,
這里看起來像曲線是因為樣本點相互挨得很近,
柱狀圖
柱形圖 matplotlib.pyplot.bar(*args, **kwargs) 大家應該都非常了解了
這里,我們直接用上面的代碼,僅把 plt.plot(X, y) 改成 plt.bar(X, y) 試一下
plt.bar([1,2,3],[1,2,3])

散點圖
散點圖 matplotlib.pyplot.scatter(*args, **kwargs) 就是呈現在二維平面的一些點,這種影像的需求也是非常常見的
比如,我們通過 GPS 采集的資料點,它會包含經度以及緯度兩個值,這樣的情況就可以繪制成散點圖
# X,y 的坐標均有 numpy 在 0 到 1 中隨機生成 1000 個值
X = np.random.ranf(1000)
y = np.random.ranf(1000)
# 向方法中 `*args` 輸入 X,y 坐標
plt.scatter(X, y)

餅圖
餅狀圖 matplotlib.pyplot.pie(*args, **kwargs) 在有限串列以百分比呈現時特別有用,你可以很清晰地看出來各類別之間的大小關系,以及各類別占總體的比例,
plt.pie([1, 2, 3, 4, 5])

量場圖
量場圖 matplotlib.pyplot.quiver(*args, **kwargs) 就是由向量組成的影像,在氣象學等方面被廣泛應用
從影像的角度來看,量場圖就是帶方向的箭頭符號
X, y = np.mgrid[0:10, 0:10]
plt.quiver(X, y)

等高線圖
中學學習地理的時候,我們就知道等高線了
等高線圖 matplotlib.pyplot.contourf(*args, **kwargs) 是工程領域經常接觸的一類圖,它的繪制程序稍微復雜一些
# 生成網格矩陣
x = np.linspace(-5, 5, 500)
y = np.linspace(-5, 5, 500)
X, Y = np.meshgrid(x, y)
# 等高線計算公式
Z = (1 - X / 2 + X ** 3 + Y ** 4) * np.exp(-X ** 2 - Y ** 2)
plt.contourf(X, Y, Z)

圖形樣式
上面,我們繪制了簡單的基礎圖形,但這些圖形都不美觀
我們已經知道了,線形圖通過 matplotlib.pyplot.plot(*args, **kwargs) 方法繪出
其中,args 代表資料輸入,而 kwargs 的部分就是用于設定樣式引數了,
折線圖
二維線形圖 包含的引數 超過 40 余項,其中常用的也有 10 余項,選取一些比較有代表性的引數列舉如下:
| 引數 | 含義 |
|---|---|
alpha= | 設定線型的透明度,從 0.0 到 1.0 |
color= | 設定線型的顏色 |
fillstyle= | 設定線型的填充樣式 |
linestyle= | 設定線型的樣式 |
linewidth= | 設定線型的寬度 |
marker= | 設定標記點的樣式 |
| …… | …… |
至于每一項引數包含的設定選項,大家需要通過 官方檔案 詳細了解
下面,我們重新繪制一個三角函式圖形
# 在 -2PI 和 2PI 之間等間距生成 1000 個值,也就是 X 坐標
X = np.linspace(-2 * np.pi, 2 * np.pi, 1000)
# 計算 sin() 對應的縱坐標
y1 = np.sin(X)
# 計算 cos() 對應的縱坐標
y2 = np.cos(X)
# 向方法中 `*args` 輸入 X,y 坐標
plt.plot(X, y1, color='r', linestyle='--', linewidth=2, alpha=0.8)
plt.plot(X, y2, color='b', linestyle='-', linewidth=2)

散點圖
散點圖也是相似的,它們的很多樣式引數都是大同小異,需要大家閱讀 官方檔案 詳細了解,
| 引數 | 含義 |
|---|---|
s= | 散點大小 |
c= | 散點顏色 |
marker= | 散點樣式 |
cmap= | 定義多類別散點的顏色 |
alpha= | 點的透明度 |
edgecolors= | 散點邊緣顏色 |
# 生成隨機資料
x = np.random.rand(1000)
y = np.random.rand(1000)
colors = np.random.rand(1000)
size = np.random.normal(50, 60, 1000)
# 繪制散點圖
plt.scatter(x, y, s=size, c=colors)

餅圖
餅狀圖通過 matplotlib.pyplot.pie() 繪出
我們也可以進一步設定它的顏色、標簽、陰影等各類樣式
# 各類別標簽
label = 'a','b','c','d'
# 各類別顏色
color = 'r', 'g', 'r', 'g'
# 各類別占比
size = [1, 2, 3, 4]
# 各類別的偏移半徑
explode = (0, 0, 0, 0, 0.2)
# 繪制餅狀圖
plt.pie(size, colors=color, explode=explode,
labels=label, shadow=True, autopct='%1.1f%%')
# 餅狀圖呈正圓
plt.axis('equal')

組合圖形樣式
上面演示了單個簡單影像的繪制
實際上,我們往往會遇到將幾種型別的一樣的圖放在一張圖內顯示,也就是組合圖的繪制,
其實很簡單,你只需要將所需圖形的代碼放置在一起就可以了,比如繪制一張包含柱形圖和折線圖的組合圖,
x = [1, 3, 5, 7, 9, 11, 13, 15, 17, 19]
y_bar = [3, 4, 6, 8, 9, 10, 9, 11, 7, 8]
y_line = [2, 3, 5, 7, 8, 9, 8, 10, 6, 7]
plt.bar(x, y_bar)
plt.plot(x, y_line, '-o', color='y')

圖形位置
figure物件
在圖形的繪制程序中,你可能需要調整圖形的位置,或者把幾張單獨的圖形拼接在一起
此時,我們就需要引入 plt.figure 圖形物件了
# 生成資料
x = np.linspace(0, 10, 20)
y = x * x + 2
# 新建圖形物件
fig = plt.figure()
# 控制畫布的左, 下, 寬度, 高度
axes = fig.add_axes([0.5, 0.5, 0.8, 0.8])
axes.plot(x, y, 'r')

上面的繪圖代碼中,你可能會對 figure 和 axes 產生疑問
Matplotlib 的 API 設計的非常符合常理,在這里,figure 相當于繪畫用的畫板,而 axes 則相當于鋪在畫板上的畫布
我們將影像繪制在畫布上,于是就有了 plot,set_xlabel 等操作,

借助于圖形物件,我們可以實作大圖套小圖的效果
# 新建畫板
fig = plt.figure()
# 大畫布
axes1 = fig.add_axes([0.1,0.1,0.8,0.8])
# 小畫布
axes2 = fig.add_axes([0.2,0.5,0.4,0.3])
# 大畫布
axes1.plot(x,y,'r')
# 小畫布
axes2.plot(x,y,'g')

上面的繪圖代碼中,使用了 add_axes() 方法向我們設定的畫板 figure 中添加畫布 axes
subplots物件
在 Matplotlib 中,還有一種添加畫布的方式,那就是 plt.subplots(),它和 axes 都等同于畫布
flg,axes = plt.subplots()
axes.plot(x,y,'r')
借助于 plt.subplots(),我們就可以實作子圖的繪制,也就是將多張圖按一定順序拼接在一起
# 子圖為 1 行,2 列
flg,axes = plt.subplots(nrows=1,ncols=2)
for ax in axes:
ax.plot(x,y,'r')

或者:
x = [1,2,3]
y = [1,2,3]
flg,axes = plt.subplots(nrows=1,ncols=2)
axes[0].plot(x,y,'r')
axes[1].plot(x[::-1],y,'r')

通過設定 plt.subplots 的引數,可以實作調節畫布尺寸和顯示精度
fig, axes = plt.subplots(
# 通過 figsize 調節尺寸, dpi 調節顯示精度
figsize=(16, 9), dpi=50
)
axes.plot(x, y, 'r')

規范繪圖方法
首先,任何圖形的繪制,都建議通過 plt.figure() 或者 plt.subplots() 管理一個完整的圖形物件
而不是簡單使用一條陳述句,例如 plt.plot(...) 來繪圖
管理一個完整的圖形物件,有很多好處, 在圖形的基礎上,給后期添加圖例,圖形樣式,標注等預留了很大的空間, 除此之外代碼看起來也更加規范,可讀性更強.
接下來,我們就通過幾組例子來演示規范的繪圖方法.
添加圖示題/圖例
繪制包含圖示題、坐標軸標題以及圖例的圖形,舉例如下:
fig, axes = plt.subplots()
# 橫軸名稱
axes.set_xlabel('x label')
axes.set_ylabel('y label')
# 圖形名稱
axes.set_title('title')
axes.plot(x, x**2)
axes.plot(x, x**3)
# 圖例
axes.legend(["y = x**2", "y = x**3"], loc=0)

圖例中的 loc 引數標記圖例位置,1,2,3,4 依次代表:右上角、左上角、左下角,右下角;0 代表自適應
線型、顏色、透明度
在 Matplotlib 中,你可以設定線的顏色、透明度等其他屬性
fig,axes = plt.subplots()
axes.plot(x, x+1, color="red", alpha=0.5)
axes.plot(x, x+2, color="#1155dd")
axes.plot(x, x+3, color="#15cc55")
而對于線型而言,除了實線、虛線之外,還有很多豐富的線型可供選擇
fig, ax = plt.subplots(figsize=(12, 6))
# 線寬
ax.plot(x, x+1, color="blue", linewidth=0.25)
ax.plot(x, x+2, color="blue", linewidth=0.50)
ax.plot(x, x+3, color="blue", linewidth=1.00)
ax.plot(x, x+4, color="blue", linewidth=2.00)
# 虛線型別
ax.plot(x, x+5, color="red", lw=2, linestyle='-')
ax.plot(x, x+6, color="red", lw=2, ls='-.')
ax.plot(x, x+7, color="red", lw=2, ls=':')
# 虛線交錯寬度
line, = ax.plot(x, x+8, color="black", lw=1.50)
line.set_dashes([5, 10, 15, 10])
# 符號
ax.plot(x, x + 9, color="green", lw=2, ls='--', marker='+')
ax.plot(x, x+10, color="green", lw=2, ls='--', marker='o')
ax.plot(x, x+11, color="green", lw=2, ls='--', marker='s')
ax.plot(x, x+12, color="green", lw=2, ls='--', marker='1')
# 符號大小和顏色
ax.plot(x, x+13, color="purple", lw=1, ls='-', marker='o', markersize=2)
ax.plot(x, x+14, color="purple", lw=1, ls='-', marker='o', markersize=4)
ax.plot(x, x+15, color="purple", lw=1, ls='-',
marker='o', markersize=8, markerfacecolor="red")
ax.plot(x, x+16, color="purple", lw=1, ls='-', marker='s', markersize=8,
markerfacecolor="yellow", markeredgewidth=2, markeredgecolor="blue")

畫布網格、坐標軸范圍
有些時候,我們可能需要顯示畫布網格或調整坐標軸范圍
設定畫布網格和坐標軸范圍
這里,我們通過指定 axes[0] 序號,來實作子圖的自定義順序排列
fig, axes = plt.subplots(1, 2, figsize=(10, 5))
# 顯示網格
axes[0].plot(x, x**2, x, x**3, lw=2)
axes[0].grid(True)
# 設定坐標軸范圍
axes[1].plot(x, x**2, x, x**3)
axes[1].set_ylim([0, 60])
axes[1].set_xlim([2, 5])

除了折線圖,Matplotlib 還支持繪制散點圖、柱狀圖等其他常見圖形
下面,我們繪制由散點圖、梯步圖、條形圖、面積圖構成的子圖
n = np.array([0, 1, 2, 3, 4, 5])
fig, axes = plt.subplots(1, 4, figsize=(16, 5))
axes[0].scatter(x, x + 0.25*np.random.randn(len(x)))
axes[0].set_title("scatter")
axes[1].step(n, n**2, lw=2)
axes[1].set_title("step")
axes[2].bar(n, n**2, align="center", width=0.5, alpha=0.5)
axes[2].set_title("bar")
axes[3].fill_between(x, x**2, x**3, color="green", alpha=0.5)
axes[3].set_title("fill_between")

圖形標注方法
當我們繪制一些較為復雜的影像時,閱讀物件往往很難全面理解影像的含義,而此時,影像標注往往會起到畫龍點睛的效果
影像標注,就是在畫面上添加文字注釋、指示箭頭、圖框等各類標注元素
Matplotlib 中,文字標注的方法由 matplotlib.pyplot.text() 實作
最基本的樣式為 matplotlib.pyplot.text(x, y, s),其中 x, y 用于標注位置定位,s 代表標注的字串
除此之外,你還可以通過 fontsize= , horizontalalignment= 等引數調整標注字體的大小,對齊樣式等
下面,我們舉一個對柱形圖進行文字標注的示例
fig,axes = plt.subplots()
# 柱形圖橫坐標
x_bar = [
10,20,30,40,50
]
# 柱形圖縱坐標
y_bar = [
0.5,0.6,0.3,0.4,0.8
]
# 繪制柱形圖
bars = axes.bar(x_bar,y_bar,color="blue",label=x_bar,width=2)
for i,rect in enumerate(bars):
# 獲取柱形圖縱坐標
x_text = rect.get_x()
# 獲取柱子的高度并增加0.01
y_text = rect.get_height() + 0.01
# 標注文字
plt.text(x_text,y_text,'%.1f' % y_bar[i])

除了文字標注之外,還可以通過 matplotlib.pyplot.annotate() 方法向影像中添加箭頭等樣式標注
接下來,我們向上面的例子中增添一行增加箭頭標記的代碼
for i, rect in enumerate(bars):
# 獲取柱形圖縱坐標
x_text = rect.get_x()
# 獲取柱子的高度并增加0.01
y_text = rect.get_height() + 0.01
# 標注文字
plt.text(x_text, y_text, '%.1f' % y_bar[i])
# 增加箭頭標注
plt.annotate(
'Min', xy=(32, 0.3), xytext=(36, 0.3),
arrowprops=dict(facecolor='black', width=1, headwidth=7)
)

上面的示例中,xy=() 表示標注終點坐標,xytext=() 表示標注起點坐標
在箭頭繪制的程序中,arrowprops=() 用于設定箭頭樣式,facecolor= 設定顏色,width= 設定箭尾寬度,headwidth= 設定箭頭寬度,可以通過 arrowstyle= 改變箭頭的樣式,
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/385606.html
標籤:python
上一篇:【Java資料結構】—— 雙向鏈表及帶傀儡節點雙向鏈表的實作
下一篇:python幾行代碼實作郵件決議
