假設我有一個二進制不平衡資料集,如下所示:
from collections import Counter
from sklearn.datasets import make_classification
from matplotlib import pyplot as plt
from imblearn.over_sampling import SMOTE
# fake dataset
X, y = make_classification(n_samples=10000, n_features=2, n_redundant=0,
n_clusters_per_class=1, weights=[0.99], flip_y=0, random_state=1)
# summarize class distribution
counter = Counter(y)
print(counter)
Counter({0: 9900, 1: 100})
使用SMOTE過采樣少數類:
oversample = SMOTE()
Xs, ys = oversample.fit_resample(X, y)
現在,顯示類分布的直方圖:
一種。過采樣前:
plt.hist(y)

灣。過采樣后:
plt.hist(ys)

但我想在過采樣圖中顯示以不同顏色生成的少數類的一部分。
預期輸出:
類似于下圖:

uj5u.com熱心網友回復:
您可以
轉載請註明出處,本文鏈接:https://www.uj5u.com/net/440766.html
標籤:Python matplotlib 数据可视化 不平衡数据 打击
