我对lda-c-dist软件包的推理结果有疑问。查看推理结果时应显示多少个单词?例如,如果我将字数设置为非常大的数N(假设所有项的数目都是N),则似乎存在一些字组。在每个组中,单词的索引范围从1到N.
我得到的是, 假设术语数为10,并且我将显示的单词数分配给10。
Topic 0xx:
001
008
009
002
003
007
000
004
005
006
看来,我可能应该设置显示3而不是10的单词。
那么,关于一个主题,当通过调用topics.py来查看主题时,应该指定多少个单词?
此外,我将使用此输出来计算两个主题的相似性。所以...
答案 0 :(得分:0)
实际上,词汇表可以包含多少项目。此处显示的内容仅为指示的有限数量的概率降序。