我正在研究最后一年的项目,必须使用无监督学习(KMeans算法)进行编码。要从各种游戏中预测出适合其认知技能水平的游戏。技能是专心,响应时间,记忆和注意力。
第一个问题是我找不到包含技能和游戏的适当数据集。然后,我不确定如何找到群集。有没有可能找到合适的数据集以及如何对它们进行聚类的方法?
此外,没有数据集怎么办(不使用强化学习)?
预先感谢
答案 0 :(得分:0)
首先,我对您的问题感到困惑。但是我会尽我所能来回答。 K均值聚类是一种无监督的聚类方法,它基于数据彼此之间的距离(通常是欧几里得)。具有相似特征的数据点之间的距离会更近,然后将它们聚集成同一聚类。
我假设您正在尝试构建一种算法,该算法可以根据个人的注意力,响应时间,记忆力和注意力技巧来输出推荐的游戏。
第一个问题是我找不到包含技能和游戏的适当数据集。
对于数据集,您可以从字面上构建自己的外观,如下所示:
标签= [游戏]
特征= [注意力,反应时间,记忆,注意力]
标签是n乘1的向量,其中n是游戏数。特征是n x 4的向量,每个技能的范围可以是1-5,最高是5。然后用您喜欢的经典游戏填充它。
例如,俄罗斯方块可以是您的第一款游戏,您可以将其添加到数据集中,如下所示:
label = [俄罗斯方块]
功能= [5,2,1,4]
您需要在俄罗斯方块中集中精力和注意力,但是您并不需要良好的响应时间,因为这些障碍很慢并且您不需要记住任何东西。
然后我不确定如何找到群集。
您首先必须确定要使用的距离,例如曼哈顿,欧几里得等,然后您需要确定簇的数量。 k均值算法非常简单,只需观看以下视频即可学习:https://www.youtube.com/watch?v=_aWzGGNrcic
此外,没有数据集怎么办(不使用强化学习)?
这个问题使0有意义,因为首先,如果没有数据,如何将它们聚类?想象一下,您的朋友要您将所有绿色苹果和红色苹果分开。但是它们从来没有给你苹果。这是不可能的。
第二,在这种情况下,我不确定您所说的强化学习是什么意思。强化学习是关于存在于环境中的主体,并学习如何在此环境中表现最佳以最大化其内部奖励。例如,一个人进入赌场并试图赚最大的钱。它与数据集无关。