PCA的输出是什么以及它如何有用?

时间:2017-11-01 04:45:26

标签: machine-learning pca eigenvector dimensionality-reduction data-presentation

PCA是一种降维算法,有助于减少数据的维数。 我还没有理解的是PCA给出了降序的特征向量输出,如PC1,PC2,PC3等。所以这将成为我们数据的新轴。

  • 我们可以在哪里应用这些新轴来预测测试集数据?

  • 我们实现了从n到n-k的维数减少。

  • 如何从我们的数据中获取最有用的变量并从数据中删除不重要的列?
  • PCA有替代方法吗?

1 个答案:

答案 0 :(得分:1)

PCA的想法是将维数减少到由具有最大方差的n-k个特征向量创建的子空间,从而导致映射到新子空间的数据中的最大方差。

此外,可以使用PCA来降低您的维度,而无需了解您的训练数据类别,这意味着它无人监督。

如果你知道训练数据的类,另一个选择是使用LDA,它试图找到最大化类间变化的特征空间。

希望这有帮助