考虑一个案例,我们有n
名学生,m
科目,每个科目都有q
个考试成绩。现在我们有兴趣确定在某些科目中以类似方式表现的学生群体。请参见下图以进一步了解它(5名学生,5名科目,每个科目有5个考试成绩,以点表示):
根据这些多维测试分数,我们如何识别相似的组?
我的方法:我尝试在bi-clustering R
包中使用mixOmics,但我发现此包中的cim
函数不允许使用多维数据。由于有q
个测试成绩(> 1)。我们需要缩小尺寸吗?如果是,我们如何在聚类之前减少这些二聚体。
这是虚拟数据
# 6 students, 7 subjects and 5 tests
df <- data.frame(rnorm(35,3,2),rnorm(35,3,2),rnorm(35,3,2),rnorm(35,3,2),rnorm(35,3,2),rnorm(35,3,2))
colnames(df) <- paste0("Std",1:6)
row.names(df) <- paste0(rep(paste0("sub",1:7),each=5),1:5)