我知道有一些用于可視化缺失值的軟體包,例如missingno. 如何使用 Pandas 和 Matplotlib 在沒有附加包的情況下可視化缺失值模式?我希望像下圖這樣丟失的資料是白色的:

uj5u.com熱心網友回復:
您可以使用 matplot 獲取所需內容:
import pandas as pd
plt.rcParams["figure.figsize"] = (20, 10)
df = pd.read_excel("C:/Users/Jhonny/Desktop/titanic.xlsx")
plt.imshow(df.isnull(), cmap='hot', aspect='auto')
plt.show()
注意:我使用了來自 kaggle 的泰坦尼克號資料的子集。
結果:
從索引 0 開始,此熱圖可視化立即告訴我們缺失值的分布方式(以及位置)。

我知道,我現在沒那么喜歡。Matplot 需要更多的作業才能將這個原始圖形變成更好的東西。
但如果你想要更好更快的東西,我真的建議seaborn。
Seaborn是一個基于 matplotlib的 Python 資料可視化庫。它提供了一個高級界面,用于繪制有吸引力且資訊豐富的統計圖形。
import seaborn as sns
sns.heatmap(df.isnull(), cbar=False)
plt.show()

轉載請註明出處,本文鏈接:https://www.uj5u.com/net/317806.html
標籤:Python 熊猫 matplotlib 缺失数据
