标签: nlp unsupervised-learning
我有大量关于科学主题的文章,我想确定文本的可信度。
我猜单词的选择很重要(例如,使用诸如“ SVM”或“ Tensorflow”之类的特定术语倾向于表明作者比他/他使用“大数据”更了解该主题),但我不确定如何检索该信息。尽管噪声很大,TFIDF可能会有所帮助。
由于在该主题上已完成任何工作,或者您有任何想法吗? 谢谢