我是TensorFlow和Document Similarity / Topic Modeling的新手,因此,如果我的问题没有完全合理,我会道歉。
根据我的有限理解,主题建模是使用LSA,LDA等算法完成的。我已经看过使用gensim和LSA的代码,但是对于我想到的大量文档来说,训练的时间非常长。因此CPU和RAM资源非常繁重。
Tensorflow似乎没有本机LSA或LDA实现。
我希望得到一个意见:
使用Tensorflow实施LDA会比使用gensim实现更好吗?
有人可以告诉我其他Tensorflow原语我应该注意文档相似性而不是LDA吗?
如果我的问题过于模糊,并且没有提供足够的信息以作出适当的回应,我再次感到抱歉。我是这个领域的新手,我很感激有人可以指点我的任何指示。
感谢您的时间。
此致 Jeetu