参数是什么" mds"在pyLDAvis.sklearn.prepare() - 函数中意味着什么?

时间:2018-06-19 08:02:04

标签: python scikit-learn documentation lda mds

我希望可视化使用LDA算法进行的主题建模。我使用名为" pyldavis"的python模块。而作为环境的jupyter笔记本。

import pyLDAvis.sklearn
...
pyLDAvis.sklearn.prepare(lda_tf, dtm_tf, tf_vectorizer)
pyLDAvis.sklearn.prepare(lda_tf, dtm_tf, tf_vectorizer, mds='mmds')
pyLDAvis.sklearn.prepare(lda_tf, dtm_tf, tf_vectorizer, mds='tsne')

它确实工作正常,但我不太了解mds参数......即使阅读完文档后:

  

mds:函数或函数的字符串表示

     

将topic_term_dists作为输入并以2距离矩阵输出n_topics的函数。输出近似于主题之间的距离。有关默认函数的详细信息,请参阅js_PCoA()。如果为后两者安装了sklearn包,则字符串表示当前接受pcoa(或大写变体),mmds(或大写变体)和tsne(或大写变体)。

有人知道btw有什么不同吗? mds =' pcoa',mds =' mmds',mds =' tsne'?

谢谢!

2 个答案:

答案 0 :(得分:0)

我不是专家,但是遇到了相同的问题,在搜索了关键字“ pcoa”,“ mmds”,“ tsne”之后,我了解到这些是降低维数的不同技术。我猜“ mds”代表“多维缩放”。

pyLDAvis在2D上绘制主题以确定其位置时使用此配置。

答案 1 :(得分:0)

通过Jensen-Shannon发散&

pcoa:主坐标分析(又称古典多维比例缩放)

mmds:度量多维缩放比例

tsne:t分布随机邻居嵌入