Question

我希望可视化使用LDA算法进行的主题建模。我使用名为＆＃34; pyldavis＆＃34;的python模块。而作为环境的jupyter笔记本。

import pyLDAvis.sklearn
...
pyLDAvis.sklearn.prepare(lda_tf, dtm_tf, tf_vectorizer)
pyLDAvis.sklearn.prepare(lda_tf, dtm_tf, tf_vectorizer, mds='mmds')
pyLDAvis.sklearn.prepare(lda_tf, dtm_tf, tf_vectorizer, mds='tsne')

它确实工作正常，但我不太了解mds参数......即使阅读完文档后：

mds：函数或函数的字符串表示

将topic_term_dists作为输入并以2距离矩阵输出n_topics的函数。输出近似于主题之间的距离。有关默认函数的详细信息，请参阅js_PCoA（）。如果为后两者安装了sklearn包，则字符串表示当前接受pcoa（或大写变体），mmds（或大写变体）和tsne（或大写变体）。

有人知道btw有什么不同吗？ mds =＆＃39; pcoa＆＃39;，mds =＆＃39; mmds＆＃39;，mds =＆＃39; tsne＆＃39;？

谢谢！

Answer 1

我不是专家，但是遇到了相同的问题，在搜索了关键字“ pcoa”，“ mmds”，“ tsne”之后，我了解到这些是降低维数的不同技术。我猜“ mds”代表“多维缩放”。

pyLDAvis在2D上绘制主题以确定其位置时使用此配置。

Answer 2

通过Jensen-Shannon发散＆

pcoa：主坐标分析（又称古典多维比例缩放）

mmds：度量多维缩放比例

tsne：t分布随机邻居嵌入

参数是什么＆＃34; mds＆＃34;在pyLDAvis.sklearn.prepare（） - 函数中意味着什么？

2 个答案: