稀疏矩阵上的聚类

时间:2016-09-01 15:42:54

标签: python cluster-computing sparse-matrix similarity

我是使用python学习数据分析的新手。

我有一个关于如何对稀疏矩阵进行分类或聚类的问题。我有一个像这样的稀疏矩阵:

        A   B   C   D   E   
day1    0   0   1   0   1   
day2    0   1   0   0   0   
day3    0   0   1   0   1   
day4    0   0   1   1   0   
day5    1   0   0   1   1   
day6    1   0   0   0   1   
day7    0   1   1   0   0   
day8    1   1   0   1   1   
day9    1   0   0   0   1   
day10   0   0   1   0   0   

每列代表当天运行的作业,我想计算天数之间的相似性,以便将每一天分配到一个集群中。

我希望我的输出看起来像这样:

        A   B   C   D   E   Group
day1    0   0   1   0   1   1
day2    0   1   0   0   0   2
day3    0   0   1   0   1   1
day4    0   0   1   1   0   1
day5    1   0   0   1   1   3
day6    1   0   0   0   1   1
day7    0   1   1   0   0   1
day8    1   1   0   1   1   3
day9    1   0   0   0   1   1
day10   0   0   1   0   0   2

我不知道真正的集群索引应该是什么样的,所以我补上了。

有没有人告诉我应该使用哪种算法或群集方法来解决问题?我真的很感激!

0 个答案:

没有答案