我是使用python学习数据分析的新手。
我有一个关于如何对稀疏矩阵进行分类或聚类的问题。我有一个像这样的稀疏矩阵:
A B C D E
day1 0 0 1 0 1
day2 0 1 0 0 0
day3 0 0 1 0 1
day4 0 0 1 1 0
day5 1 0 0 1 1
day6 1 0 0 0 1
day7 0 1 1 0 0
day8 1 1 0 1 1
day9 1 0 0 0 1
day10 0 0 1 0 0
每列代表当天运行的作业,我想计算天数之间的相似性,以便将每一天分配到一个集群中。
我希望我的输出看起来像这样:
A B C D E Group
day1 0 0 1 0 1 1
day2 0 1 0 0 0 2
day3 0 0 1 0 1 1
day4 0 0 1 1 0 1
day5 1 0 0 1 1 3
day6 1 0 0 0 1 1
day7 0 1 1 0 0 1
day8 1 1 0 1 1 3
day9 1 0 0 0 1 1
day10 0 0 1 0 0 2
我不知道真正的集群索引应该是什么样的,所以我补上了。
有没有人告诉我应该使用哪种算法或群集方法来解决问题?我真的很感激!