PCA分析和因子分析

时间:2023-12-05 13:25:08

#由此说明使用prcomp函数时,必须使用标准化过的原始数据。如果使用没有标准化的raw数据(不是相关系数矩阵或者协方差矩阵),必须将参数scale. = T

<result>$sdev #表示标准差,意思是 <result>$sdev[1] = sqrt(var(<result>$x))

<result>$rotation #表示的是特征向量矩阵,也可以由eigen(<输入的原数据>)$vector 得到

<result>$x #表示的是主成分结果矩阵,可以由<输入的原数据>%*%<result>$rotation得到

==============================================================

p1 = princomp(scr,cor = T);p1 ###看来,必须把cor = T加上才可以得到正确的值,否则是使用cov计算的结果,并且计算过程中有新的参数加入
#cor = False :cv <- covmat$cov * (1 - 1/n.obs)

#cor = True: cv <- covmat$cov * (1 - 1/n.obs),sds <- sqrt(diag(cv)),cv <- cv/(sds %o% sds)
#sdev = sqrt(eigen(cv, symmetric = TRUE)$value)
#下面的证明表明,使用cov和使用cor的结果还是十分的不一样的

<result>$sdev  #主成分结果矩阵每一列的标准差

<result>$loading #特征向量矩阵

<result>$scores # 主成分结果矩阵

注意:在使用princomp函数时,必须使用标准化后的原始矩阵(不能是相关系数矩阵或者协方差矩阵);如果使用未被标准化的原始数据,必须加入参数:cor = T 。

=================================================================================================

library(psych)
p32 = principal(scr,nfactors = 5,rotate = "varimax");p32

p3 = principal(scrcor,nfactors = 5,rotate = "varimax");p3

这两个运行的结果一样,说明在principal函数中,可以使用原始数据或相关系数矩阵。这个可以使用相关系数矩阵或者协方差矩阵,是十分不同于之前的两个主成分求值函数的。

p32$values #特征值,等同于结果矩阵的方差值

scr是经过标准化的数据集;r是原始矩阵,没有经过标准化的数据。

cor(scr)
cov(scr)

cor(r)

cov(r)

结果证明,经过标准化的原始矩阵的相关系数矩阵和协方差矩阵一样;但是没有经过标准化的数据集的协方差和相关系数矩阵是不一样的。

ep3 = eigen(cor(scr))
loading = ep3$vectors %*% sqrt(diag(ep3$values))
sign.tot <- vector(mode = "numeric", length = 5);sign.tot
sign.tot <- sign(colSums(loading));sign.tot
sign.tot[sign.tot == 0] <- 1;sign.tot
loadings <- loading %*% diag(sign.tot);loadings
varimax(loadings)$loadings

最后的loadings值就是上面的过程得到的,当然此处参数是 nfactors = 5, rotate = "varimax" , r = scr.

=====================================================================

以下内容来自于网址:https://site.douban.com/182577/widget/notes/11806604/note/262310174/

最常用的求解PCA的函数是stats包的
prcomp()和princomp( )。
前者采用观测阵的奇异值分解方法,后者采用相关系数阵的特征值分解方法。
输出结果上,包括特征值,载荷,主成分得分等,结果基本相似。
同时可以利用print( ),summary( )显示输出结果。
plot( )画scree plot,biplot( )绘制biplot。

SciViews包的pcomp()综合了上面两个函数的方法。

psych包的相关函数
这个包是关于心理计量的包,其中有关于主成分的函数principal( )
这个函数是作为因子分析的主成分解法存在的,要和fa.parallel()结合使用。
还有一个心理学的包:psy包,也有相关的函数

====================================================

我想说的是,principal()函数得到结果中,$value 是特征值,$loading是由因子载荷矩阵,是因子分析的主成份解法中的概念,$scores是因子得分系数。

============

http://blog.csdn.net/lilanfeng1991/article/details/36190841#

还可以参考上文

原谅我,现在还是有点模糊,都花了好几天了,算了,以后再慢慢弄明白