标签: python gensim lda topic-modeling weighting
文献讨论了潜在狄利克雷分配的不同术语加权方案。例如,如何在Gensim中应用它?我是否应该将术语频率(以词袋形式)乘以适当的权重,并对此应用LDA?因此,例如,对每一项应用反向文档频率权重就相当于在TF-IDF向量上运行LDA。