降維
PCA演算法及其應用
主成分分析(PCA),通常用于高維資料的探索與可視化,可以拔具有相關性的高維變數轉化為線性無關的低維變數,稱為主成分,能夠盡可能保存原始資料的資訊,
幾個概念
方差:樣本與樣本均值的差的平方和的均值,用來度量一組資料的分散程度,
協方差:用于度量兩個變數的線性相關程度,
特征向量:描述資料集結構的非零向量,
原理:矩陣的主成分就是其協方差矩陣對應的特征向量,按照對應特征值排序,分為第一主成分,第二主成分,以此類推,
在sklearn中使用decomposition模塊中的PCA進行降維,
實體,用PCA將鳶尾花資料進行降維,可視化,
代碼見: https://github.com/zwdnet/MyQuant/blob/master/26/PCAtest.py

非負矩陣分解(NMF)
是在矩陣中所有元素均為非負數約束條件下的矩陣分解方法,
基本思想:給定一個非負矩陣V,NMF能夠找到一個非負矩陣W和一個非負矩陣H,使得二者的乘積近似等于矩陣V中的值,
W矩陣,從原矩陣V中提取的特征,
H矩陣,系數矩陣,
分解目標,最小化W與H乘積與V的差異,
在sklearn中使用decomposition模塊中的NMF進行分解,
實體,用NMF進行人臉影像資料集Olivetti特征提取,
代碼見: https://github.com/zwdnet/MyQuant/blob/master/26/face.py
這是原圖

NMF演算法的結果

PCA演算法的結果

可以看到NMF演算法好一點,
我發文章的四個地方,歡迎大家在朋友圈等地方分享,歡迎點“在看”,
我的個人博客地址:https://zwdnet.github.io
我的知乎文章地址: https://www.zhihu.com/people/zhao-you-min/posts
我的博客園博客地址: https://www.cnblogs.com/zwdnet/
我的微信個人訂閱號:趙瑜敏的口腔醫學學習園地
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/188625.html
標籤:Python
上一篇:Python簡單介紹
下一篇:python之enumerate
