因此,我正在使用一个数据集,其中涉及有关泰坦尼克号上乘客的数据,您可能会发现here。
所以我在这里使用提供的火车数据。我想使用来创建仅包含数字(无因子!)的数据集的模型矩阵。 model.matrix函数。
然后,从该数据集中删除Survived变量。
从这个矩阵中,我想将PCA拟合到上一步中的矩阵,并绘制观测值的分数(仅使用前两个维度),然后根据Survived变量对它们进行着色。
我尝试了几种方法来完成此操作,但它似乎并不准确,也没有颜色。
dtexec.exe /FILE "D:\TestPkg.dtsx"
/SET \Package.Variables[User::FilePath].Properties[Value];"C:\Test\testvariable.csv"
答案 0 :(得分:0)
您尝试过ggbiplot(titan2)
吗?
当然,如果要这样做,则必须在prcomp
上运行它之前,仅对前两列进行过滤
您能举例说明PCA的外观吗?