首先,我使用LDA模型将数据分为十个主题:
from sklearn.decomposition import LatentDirichletAllocation
lda = LatentDirichletAllocation(n_components=10,max_iter=10, n_jobs=-1,random_state=95865)
lda_trans = lda.fit_transform(X_tfidf)
为了使主题形象化,我使用TSNE将数据转换为2D,
topic_proportions = lda.transform(X_tfidf)[:1000]
from sklearn.manifold import TSNE
tsne_model = TSNE(n_components =2, learning_rate=800,angle=.99, init='pca')
topic_tsne_lda = tsne_model.fit_transform(topic_proportions)
plt.scatter(topic_tsne_lda[:,0],topic_tsne_lda[:,1])
我的问题是:如何将群集的颜色设置为不同的颜色?谢谢!