我有一组要分类的分类变量,因此我使用的是从github package获取的k模式。我想得到每个观察点(点)到它所属的集群的质心的距离。
这是我到目前为止实施的内容:
kmodes_cao = kmodes.KModes(n_clusters=6, init='Cao', verbose=1)
kmodes_cao.fit_predict(data)
# Print cluster centroids of the trained model.
print('k-modes (Cao) centroids:')
print(kmodes_cao.cluster_centroids_)
# Print training statistics
print('Final training cost: {}'.format(kmodes_cao.cost_))
print('Training iterations: {}'.format(kmodes_cao.n_iter_))
我无法使用Eucledean距离,因为变量是分类的。计算每个点到其聚类质心的距离的理想方法是什么?