我正在对大型分类数据集(> 200k观察值,> 50个变量)进行分层聚类。在基于sklearn.cluster.AgglomerativeClustering计算了一些代码之后,我确实收到了新的群集标签,但是我不知道如何检查这些群集的功能是什么?我想知道它们的特征是什么,哪些特征与它们不同。
在大多数示例中,我看到了一个可以提供一些见解的图表,但是在这种情况下,这不是解决方案,因为只有分类数据。带有节点标签的决策树可以很好地工作,只要标签形式为“功能<一些值”即可。
有没有经过验证的解决方案,有什么想法?