PCA项目删除

时间:2015-02-03 09:29:38

标签: r pca reduction reliability

我正在进行一项调查,总共有288次观察(使用了108个完整答案)和大约200个变量。 我正在使用主成分分析,使用R。

来减少这些数字

假设理论上应将3个项目(加载到名为tmtformalizM的子数据集)中减少为一个组件(来自文献综述),7分李克特量表。 这是在相关矩阵上提取的PCA的提取,结合正交旋转(varimax):

Principal Components Analysis
Call: principal(r = tmtformalizM, nfactors = 2, rotate = "varimax", 
scores = T)
Standardized loadings (pattern matrix) based upon correlation matrix
                  RC1   RC2   h2   u2
invapproccio     0.89 -0.11 0.81 0.19
invformacomunic  0.60  0.53 0.64 0.36
verbali         -0.07  0.91 0.84 0.16

                       RC1  RC2
SS loadings           1.16 1.12
Proportion Var        0.39 0.37
Cumulative Var        0.39 0.76
Proportion Explained  0.51 0.49
Cumulative Proportion 0.51 1.00

Test of the hypothesis that 2 components are sufficient.

The degrees of freedom for the null model are  3  and the objective function      was  0.09
The degrees of freedom for the model are -2  and the objective function was     0.74 
The total number of observations was  108  with MLE Chi Square =  77.17  with prob <  NA 

Fit based upon off diagonal values = -0.86

提取显示2个组成部分(并且非常合适,怎么可能是否定的?)。 第一个PCA的Cronbach's alpha有前两项,非常低(0.35)。

我的问题是:在这种情况下,我需要删除分析中确定的第一个组成部分,但是我应该将项目3(在PCA之后)或项目3的原始调查值的分数作为最终变量保留吗? / p>

另外,考虑PCA的情况,其中提取了2个组件(每个组件3个项目),第一个组件的可靠性非常低(第二个组件呈现Alpha> 0.8)。

在这种情况下,我需要仅对第二个组件识别的项目重新执行PCA,并将这些分数作为最终变量,或者只保留第一个PCA识别的第二个组件的分数?

由于

1 个答案:

答案 0 :(得分:0)

如果您认为这三个项目应该组成一个组件,为什么要提取2个?通过拟合了解问题,查看解决方案的残差。 库(斗志) pc1&lt; - principal(tmtformalizM) 渣油(PC1)

我不明白你的第二个问题。