基于形容词集

时间:2016-04-16 02:25:27

标签: python scipy scikit-learn hierarchical-clustering

我需要一些方向。我在python中有一个包含40个属性的数组的类,如果该属性存在,那么该类的实例在其属性数组的该槽中获得1。

class.instance
 attributes = [0,1,0...]

根据我的阅读,如果我想创建一个 层次结构集群 ,我需要使用Jaccard距离,因为这些是集合。我用过:

scipy.spatial.distance.jaccard(instance1.attributes, instance2.attributes)

并获得了100个不同实例之间的距离,所以现在我有一个100 x 100矩阵。关于可视化的任何建议?

对不起,如果这没什么意义,或者我甚至不是很接近。我在这里被深水淹没,正在努力维持下去。

0 个答案:

没有答案