我试图了解如何使用无监督学习将数据拆分为群集。例如,k-均值法。
我有20列数据,如何在不损失18列必要信息的情况下将其投影到2D表面上?
我该怎么做?
任何帮助将不胜感激。
答案 0 :(得分:1)
如果您只想查看二维数据,请考虑使用t-SNE。 scikit-learn
python软件包具有可以使用的出色实现。但是,请记住,您不应将数据聚类到t-SNE输出上,因为在此过程中,数据所驻留的空间会被充分扭曲(仅保持较短的距离,而较长的距离会被较大地更改为较短或较短的距离)。更长)