TSNE为每个群集着色

时间:2018-11-11 00:29:25

标签: python scikit-learn lda

首先,我使用LDA模型将数据分为十个主题:

from sklearn.decomposition import LatentDirichletAllocation
lda = LatentDirichletAllocation(n_components=10,max_iter=10, n_jobs=-1,random_state=95865)
lda_trans = lda.fit_transform(X_tfidf)

为了使主题形象化,我使用TSNE将数据转换为2D,

topic_proportions = lda.transform(X_tfidf)[:1000]
from sklearn.manifold import TSNE
tsne_model = TSNE(n_components =2, learning_rate=800,angle=.99, init='pca')

topic_tsne_lda = tsne_model.fit_transform(topic_proportions)
plt.scatter(topic_tsne_lda[:,0],topic_tsne_lda[:,1])

散落的图片看起来像这样: enter image description here

我的问题是:如何将群集的颜色设置为不同的颜色?谢谢!

0 个答案:

没有答案