主成分分析的作用是降維,當資料量有多個維度時,有些維度對于資料的貢獻大,有些維度對資料的貢獻小,通過主成分分析,找到重要的維度,能大大減少計算量,
PCA的中心思想:
一個中心:原始特征空間的重構,
兩個基本點:最大投影方差,最小重構距離,
---------------------------------------------------------------------------------------------------------------------------------
最小重構距離通過下面的式子來構建,
重構前:(xn是去中心化的每個樣本)
表示原始的點,能表示成d個向量(d個維度)的和,通過分解,它能夠分解到兩組向量上,PCA保留了一部分,舍棄了一部分,舍棄了
這部分,保留了
這部分,a是每個分解的向量u上的長度,相乘后求和就可以重構原樣本,
重構后:
重構的代價就是使重構前后的距離最小:(兩個式子相減后剩下后面這部分)
這里的S是協方差矩陣,
則損失函式為:
使用拉格朗日乘子約束優化,式子變成:
則:
表示S的特征向量,
表示特征值 ,
---------------------------------------------------------------------------------------------------------------------------------
則PCA的步驟為:
1.求平均值,去中心化
2.計算協方差矩陣
3.特征分解
矩陣分解的程序就像下面這樣子
4.用特征值對U的列進行排序
5.選擇M個特征向量,形成
6.進行投影
轉載請註明出處,本文鏈接:https://www.uj5u.com/qukuanlian/390408.html
標籤:區塊鏈
上一篇:DApp入門
