尺寸缩减如何用于文档分类

时间:2014-09-29 14:10:57

标签: machine-learning artificial-intelligence data-mining svd

参考以下链接What does dimensionality reduction mean?,电影和人物示例很好地解释了降维 但我无法理解的是,数学特征向量如何成为电影的特征,为什么特征向量而不是任何其他向量

1 个答案:

答案 0 :(得分:1)

大多数向量都带有一些信息。所以任何矢量都可以做到这一点(实际上,由于复杂性,我们通常只计算近似的特征向量)。

特征向量具有保持大部分方差的良好特性,即强特征向量具有最多的信息,而最后的特征向量可能完全是先前的特征向量。

为了减少维数,您希望尽可能少的向量中包含尽可能多的信息。所以PCA / SVD是一个合理的选择。

但也有基于随机投影的维度降低技术