我需要一些方向。我在python中有一个包含40个属性的数组的类,如果该属性存在,那么该类的实例在其属性数组的该槽中获得1。
class.instance
attributes = [0,1,0...]
根据我的阅读,如果我想创建一个 层次结构集群 ,我需要使用Jaccard距离,因为这些是集合。我用过:
scipy.spatial.distance.jaccard(instance1.attributes, instance2.attributes)
并获得了100个不同实例之间的距离,所以现在我有一个100 x 100矩阵。关于可视化的任何建议?
对不起,如果这没什么意义,或者我甚至不是很接近。我在这里被深水淹没,正在努力维持下去。