.vocabulary_与.get_feature_names()

时间:2019-06-21 17:21:20

标签: python python-3.x scikit-learn tfidfvectorizer

这些与TfidfVectorizer中的sklearn有关。

请解释一下两者之间的异同以及何时有用。

这很令人困惑,因为它们看起来非常相似,但也有很大不同。

在这种情况下,相当有限的sklearn文档也无济于事。

1 个答案:

答案 0 :(得分:1)

基本上,我认为它们包含的信息完全相同。

但是,如果您拥有该术语的名称,并且在tf-idf矩阵中查找了该术语的列位置,那么您会使用.vocabulary_

.vocabulary_的术语名称和值在tf-idf矩阵中的列位置作为关键字。

相反,如果您知道该术语在tf-idf矩阵中的列位置,并查找其名称,那么就选择.get_feature_names()

.get_feature_names()中术语的位置对应于tf-idf矩阵中元素的列位置。