使用PCA时监督和非监督学习之间的区别

时间:2017-02-09 16:39:43

标签: machine-learning pca

我已经阅读了答案here。但是,我不能将它应用于我的一个例子,所以我可能仍然没有得到它。

这是我的例子: 假设我的程序正在尝试学习PCA(主成分分析)。 或对角化过程。 我有一个矩阵,答案是它的对角化:

  

A = PDP -1

如果我理解正确:

监督学习中我将尝试使用它的错误

我的问题是:

  • 无监督学习
  • 将会有什么作用?

我在试验时是否会因为每次试验而出错,而不是提前出错?还是别的什么?

2 个答案:

答案 0 :(得分:3)

首先,PCA既不用于分类,也不用于聚类。它是一种数据分析工具,您可以在其中找到数据中的主要组件。这可以用于例如降维。有监督和无监督的学习与此无关。

但是,在使用学习算法之前,PCA通常可以应用于数据

在有监督的学习中,你(如你所说)有一组带有"错误"的标记数据。

无监督学习中,您没有任何标签,,您根本无法验证任何内容。您所能做的就是以某种方式对数据进行聚类。目标通常是实现内部更均匀的集群。可以使用群内方差指标来衡量成功,例如

答案 1 :(得分:1)

监督学习:

  

- >您将各种标记的示例数据作为输入以及正确答案。

     

- >该算法将从中学习并根据输入开始预测正确的结果。

示例: email spam filter

无监督学习

  

- >您只提供了数据,并且没有说出标签或正确答案等内容。

     

- >算法自动分析数据中的模式。

示例: google news