如何在Python中分析t-SNE(KMeans)结果?

时间:2018-06-25 11:43:11

标签: python-3.x cluster-analysis hierarchical-clustering sklearn-pandas dimensionality-reduction

我已经将t-SNE用于KMeans聚类,但是在获得t-SNE result之后,我不知道如何将其与原始数据相关联。有人可以帮我理解结果吗?接下来我该怎么做才能通过与原始数据进行比较来更好地理解结果?

from sklearn.manifold import TSNE
fig, ax = plt.subplots(figsize = (10,8))
data = df2[['First_Policy_Year','Customer_Age','Educational_Degree','Customer_Monetary_Value','Total_Premium']].values
kmeans_clustering = KMeans( n_clusters = 3 )
idx = kmeans_clustering.fit_predict( data )

#use t-sne
X = TSNE(n_components=2, perplexity=10).fit_transform( data )

#fig = plt.figure(1)
#plt.clf()

#plot graph
colors = np.array([x for x in 'bgrcmykbgrcmykbgrcmykbgrcmyk'])
plt.scatter(X[:,0], X[:,1], c=colors[kmeans_clustering.labels_])
plt.title('K-Means (t-SNE)')
plt.show()

1 个答案:

答案 0 :(得分:0)

这个tSNE结果对我来说随机

选中此highly voted answer on stats.SE。第三张图片显示的结构比您的要多-并显示出错误的结构...

不要过度解释它。无论如何,这可能是错误的。

首先改善您的预处理。您90%的工作将用于数据准备。