如何提出有关受监督和无监督学习的问题?

时间:2017-02-18 03:49:37

标签: database machine-learning data-mining supervised-learning unsupervised-learning

我是数据挖掘概念的新手,并试图了解有监督和无监督学习之间的差异。到目前为止,我所知道的是,监督意味着从标记数据集中获取信息,无监督意味着在没有给出任何标签的情况下对数据进行聚类。

我有点理解它们是什么,但不能真正应用它们在现实生活中(不能真正应用概念来提出实时问题)。我在其中一个机器学习网络论坛上发现了以下示例问题,并且想知道是否有人可以帮助我,所以我可以用它作为一个例子来更好地理解这个概念。问题是:

  

鉴于不同车型上的以下数据集,根据有监督和无监督学习构成2个问题。

     

image

感谢任何形式的帮助。

谢谢:)

1 个答案:

答案 0 :(得分:0)

监督学习:

所以上面的数据集有11个属性。从11个属性中我们可以看到,如果是0,则列是用手动变速器对汽车进行分类的,如果为1则是自动变速器。 所以通常在监督学习中我们会得到一个带有响应变量的训练数据,所以在这种情况下,如果你认为这是一个监督学习的数据,你可以使用适当的算法训练你的模型,然后对任何测试数据预测将会是什么相应的am(手动或自动)。

无监督学习:

假设没有给出传输列,并尝试根据任何无监督学习算法将汽车分组成集群,看看你是否可以带两个集群,这两个集群是一个由手动变速器汽车组成的集群和一个由自动变速车。

您可以查看以下链接,这些是来自Andrew Ng讲座的两个视频 它们是非常短的视频,可以帮助您更好地理解。

https://www.youtube.com/watch?v=ls7Ke48jCt8&index=3&list=PLZ9qNFMHZ-A4rycgrgOYma6zxF4BZGGPW

https://www.youtube.com/watch?v=qHfUlFHGG08&list=PLZ9qNFMHZ-A4rycgrgOYma6zxF4BZGGPW&index=4