機器學習案例實操——鳶尾花

 本文做要給大家回歸一下Numpy的基礎知識，畢竟python 中的sklearn中使用的是這種資料型別，然后用一個鳶尾花分類實體給大家演示機器學習的整個程序，讓你快速入門機器學習，

1.Numpy基礎知識回顧
在這里插入圖片描述

2.辨異識花
在這里插入圖片描述

在這里插入圖片描述

下面附上代碼塊給大家O(∩_∩)O

import csv
import numpy as np
with open('iris.csv','r') as  f :
    rows=csv.reader(f)
    for row in rows:
        print(row)
    data_file=np.array(list(rows))#將資料轉換為陣列
    print(data_file.shape)#查看陣列的形狀
Data=data_file[1:,1:5].astype(float)#將字串轉為浮點
print(np.isnan(Data).any())#檢查是否有缺失值
Labels=data_file[1:,-1]#鳶尾花型別標識
print(Labels[Labels==""].shape)#檢查是否有缺失值

from sklearn.neighbors import KNeighborsClassifier
np.random.seed(0)#設定隨機種子，產生的亂數一樣
indices = np.random.permutation(len(Data))#隨機打亂陣列
print(indices)
Data_train = Data[indices[:-10]]#隨機選取140樣本作為訓練集
Labels_train = Labels[indices[:-10]]#隨機選取140樣本標簽作為訓練集

Data_test = Data[indices[-10:]]#剩下10個樣本作為測驗集
Labels_test = Labels[indices[-10:]]#剩下10個樣本標簽作為測驗集

knn = KNeighborsClassifier()#定義一個knn分類器物件
knn.fit(Data_train,Labels_train)#接收兩個引數：訓練資料集及其樣本標簽
Labels_predict = knn.predict(Data_test) #呼叫該物件的測驗方法，主要接收一個引數：測驗資料集
probility=knn.predict_proba(Data_test)#計算各測驗樣本基于概率的預測
neighborpoint=knn.kneighbors(Data_test[-1],5,False)
score=knn.score(Data_test,Labels_test,sample_weight=None)#呼叫該物件的打分方法，計算出準確率
print('Labels_predict = ')
print(Labels_predict )#輸出測驗的結果
print('Labels_test = ')
print(Labels_test)#輸出原始測驗資料集的正確標簽
print('Accuracy:',score)#輸出準確率計算結果
print(probility)

撰寫打磨課件不易，走過路過別忘記給咱點個贊，小女子在此(?′ω`?)謝過！

轉載請註明出處，本文鏈接：https://www.uj5u.com/qita/179506.html

標籤：其他

上一篇：機器人系統的能控性和能觀性（現代控制理論3）

下一篇：[Kaggle] Spam/Ham Email Classification 垃圾郵件分類（spacy）