对R

时间:2016-12-09 06:43:34

标签: r machine-learning cluster-analysis

考虑一个案例,我们有n名学生,m科目,每个科目都有q个考试成绩。现在我们有兴趣确定在某些科目中以类似方式表现的学生群体。请参见下图以进一步了解它(5名学生,5名科目,每个科目有5个考试成绩,以点表示): enter image description here

根据这些多维测试分数,我们如何识别相似的组?

我的方法:我尝试在bi-clustering R包中使用mixOmics,但我发现此包中的cim函数不允许使用多维数据。由于有q个测试成绩(> 1)。我们需要缩小尺寸吗?如果是,我们如何在聚类之前减少这些二聚体。

这是虚拟数据

# 6 students, 7 subjects and 5 tests
df <- data.frame(rnorm(35,3,2),rnorm(35,3,2),rnorm(35,3,2),rnorm(35,3,2),rnorm(35,3,2),rnorm(35,3,2))
colnames(df) <- paste0("Std",1:6)
row.names(df) <- paste0(rep(paste0("sub",1:7),each=5),1:5)

0 个答案:

没有答案