如何检测任意文本文件或数据中的主题?事先不知道主题数

时间:2019-05-13 04:44:50

标签: python nltk gensim word2vec lda

我有文本数据想要发现它的主题,我在Wikipedia等大型语料库上使用了受过训练的doc2vec,但结果不一致。有没有更好的发现主题的方法。

1 个答案:

答案 0 :(得分:1)

您可以尝试使用pod 'Alamofire' pod 'SDWebImage' pod 'Toast' pod 'MBProgressHUD' pod 'FSPagerView' pod 'IQKeyboardManagerSwift' pod 'SkyFloatingLabelTextField' gensim中实现的Hierarchical Dirichlet Process。从gensim docs

  

HDP与它的有限对应项,潜在的Dirichlet分配不同   主题模型从数据中推断出主题的数量。