无监督学习

时间:2018-09-15 16:02:59

标签: machine-learning dataset k-means unsupervised-learning

我正在研究最后一年的项目,必须使用无监督学习(KMeans算法)进行编码。要从各种游戏中预测出适合其认知技能水平的游戏。技能是专心,响应时间,记忆和注意力。

第一个问题是我找不到包含技能和游戏的适当数据集。然后,我不确定如何找到群集。有没有可能找到合适的数据集以及如何对它们进行聚类的方法?

此外,没有数据集怎么办(不使用强化学习)?

预先感谢

1 个答案:

答案 0 :(得分:0)

首先,我对您的问题感到困惑。但是我会尽我所能来回答。 K均值聚类是一种无监督的聚类方法,它基于数据彼此之间的距离(通常是欧几里得)。具有相似特征的数据点之间的距离会更近,然后将它们聚集成同一聚类。

我假设您正在尝试构建一种算法,该算法可以根据个人的注意力,响应时间,记忆力和注意力技巧来输出推荐的游戏。

  

第一个问题是我找不到包含技能和游戏的适当数据集。

对于数据集,您可以从字面上构建自己的外观,如下所示:

标签= [游戏]

特征= [注意力,反应时间,记忆,注意力]

标签是n乘1的向量,其中n是游戏数。特征是n x 4的向量,每个技能的范围可以是1-5,最高是5。然后用您喜欢的经典游戏填充它。

例如,俄罗斯方块可以是您的第一款游戏,您可以将其添加到数据集中,如下所示:

label = [俄罗斯方块]

功能= [5,2,1,4]

您需要在俄罗斯方块中集中精力和注意力,但是您并不需要良好的响应时间,因为这些障碍很慢并且您不需要记住任何东西。

  

然后我不确定如何找到群集。

您首先必须确定要使用的距离,例如曼哈顿,欧几里得等,然后您需要确定簇的数量。 k均值算法非常简单,只需观看以下视频即可学习:https://www.youtube.com/watch?v=_aWzGGNrcic

  

此外,没有数据集怎么办(不使用强化学习)?

这个问题使0有意义,因为首先,如果没有数据,如何将它们聚类?想象一下,您的朋友要您将所有绿色苹果和红色苹果分开。但是它们从来没有给你苹果。这是不可能的。

第二,在这种情况下,我不确定您所说的强化学习是什么意思。强化学习是关于存在于环境中的主体,并学习如何在此环境中表现最佳以最大化其内部奖励。例如,一个人进入赌场并试图赚最大的钱。它与数据集无关。