我正在尝试在像这样的非常大的数据帧上进行PCA。列名称Qx.y,其中x表示问题编号,y表示问题的答案编号。所以person1在第3个问题上回答1。
Q2.1 Q2.2 Q2.3 Q3.1 Q3.2 Q4.1 Q4.2 Q4.3 Q4.4 Q4.5......
person1 0 1 0 1 0 0 0 0 1 0
person2 0 0 1 0 1 0 0 0 0 1
.
.
.
我感到困惑的是与普通数据不同,这个数据使用二进制数来表示答案值 我是否必须转换回???
Q2 Q3 Q4
person1 2 1 4
person2 3 2 5
另外,我想知道某些问题是否会在不同的PC中给予更多的重视?我们可以使用一个问题来预测对另一个问题的回应吗?