是否有可能在sklearn中扭转KMeans的转变?

时间:2014-06-16 16:38:35

标签: python machine-learning scikit-learn k-means dimensionality-reduction

在对数据集进行聚类,然后使用sklearn.cluster.KMeans将数据转换为距质心的距离之后,是否可以在给定质心的情况下反转转换,恢复原始要素?

1 个答案:

答案 0 :(得分:6)

不,这是不可能的。任何降维技术一般都是有损操作。如果您丢弃某些尺寸,则无法获取此信息。 通常,即某些可能的数据集。可能存在一些数据集,其中一些信息是冗余的 - 如果特定的降维技术能够完美地利用这一点,那么就可以进行完美的逆变换。

在下图中我画了一个简单的例子。您可以将3D空间中的许多不同点配置投影到2D空间中的相同点配置。因此,只给出2D空间,无法猜测这些点来自哪个3D配置。你不知道它们的z坐标的值,并且存在无限多种可能性。

enter image description here