标签: deep-learning cluster-analysis categorical-data som
我有一个数据集,其中有5列对应于5项考试和1000行,每行对应于一个学生,每列填充有5个等级(分类),并且所有5项考试的评分系统均相同。如何对这些数据进行编码,以使用K-means,SOM等聚类算法。
我已经用原始的分类数据尝试了R中的K模式,但是由于类别本质上是顺序的并且跨列的类别是相同的,因此我不确定这是否是正确的方法。 DATASET SAMPLE