我希望可视化使用LDA算法进行的主题建模。我使用名为" pyldavis"的python模块。而作为环境的jupyter笔记本。
import pyLDAvis.sklearn
...
pyLDAvis.sklearn.prepare(lda_tf, dtm_tf, tf_vectorizer)
pyLDAvis.sklearn.prepare(lda_tf, dtm_tf, tf_vectorizer, mds='mmds')
pyLDAvis.sklearn.prepare(lda_tf, dtm_tf, tf_vectorizer, mds='tsne')
它确实工作正常,但我不太了解mds参数......即使阅读完文档后:
mds:函数或函数的字符串表示
将topic_term_dists作为输入并以2距离矩阵输出n_topics的函数。输出近似于主题之间的距离。有关默认函数的详细信息,请参阅js_PCoA()。如果为后两者安装了sklearn包,则字符串表示当前接受pcoa(或大写变体),mmds(或大写变体)和tsne(或大写变体)。
有人知道btw有什么不同吗? mds =' pcoa',mds =' mmds',mds =' tsne'?
谢谢!
答案 0 :(得分:0)
我不是专家,但是遇到了相同的问题,在搜索了关键字“ pcoa”,“ mmds”,“ tsne”之后,我了解到这些是降低维数的不同技术。我猜“ mds”代表“多维缩放”。
pyLDAvis在2D上绘制主题以确定其位置时使用此配置。
答案 1 :(得分:0)
通过Jensen-Shannon发散&
pcoa
:主坐标分析(又称古典多维比例缩放)
mmds
:度量多维缩放比例
tsne
:t分布随机邻居嵌入