諸多的對于主成分分析法具體步驟,主成分分析法這個問題都頗為感興趣的,為大家梳理了下,一起往下看看吧。
【資料圖】
1、PCA是主成分分析法。首先,不要想太多。如果用數(shù)學(xué)往下推,可能需要一些最小二乘法、SVD分解等比較難的知識,但幸運的是,如果只是想用主成分分析,可以借助計算機一步步操作。
2、非常方便快捷。我將更新一下如何使用軟件完成主成分分析的具體步驟的經(jīng)驗。這種體驗還是講究理解的。
3、看下圖,我們可以看到數(shù)據(jù)中有很多點,都是用兩個坐標來表示的,就像我前面說的。我們經(jīng)常需要用一個數(shù)字來直觀地反映大小的關(guān)系。
4、現(xiàn)在想一想,如果我們旋轉(zhuǎn)圖片,如下圖所示,當我們旋轉(zhuǎn)到某個位置時,讓各點橫坐標的平方和最大(這里用的方法是最小二乘法),此時x的坐標值就是主元素1的值。
5、通常我們在進行比較時使用主成分1。
6、很多朋友會覺得主成分分析法混淆了,還有一個原因就是為什么有主元素2,3,4,5等等。這個時候發(fā)生了什么?我們來觀察一下我剛才畫的草圖,其實讓他們有x的最大坐標,
7、其實對應(yīng)的就是把自己的Y坐標最小化!他們的y坐標不是主元素2嗎?再比如,在比較房屋質(zhì)量時,如果考慮離市中心的距離和朝向,那么數(shù)據(jù)就是2維的,可以計算出不同房屋的主元1和主元2。
8、如果加上一個地塊綠化率,就可以計算出主元3,但需要注意的是,我們通常考慮的是主元1,主元2和主元3包含的有效信息較少。如果你發(fā)現(xiàn)主元2也很大,這個時候可能就要考慮主元2了。
9、但實際上,主成分分離得越少越好。這是指標有效性評估的知識,以后會擴充很多,更新。
以上就是主成分分析法這篇文章的一些介紹,希望對大家有所幫助。
標簽: