这些与TfidfVectorizer
中的sklearn
有关。
请解释一下两者之间的异同以及何时有用。
这很令人困惑,因为它们看起来非常相似,但也有很大不同。
在这种情况下,相当有限的sklearn
文档也无济于事。
答案 0 :(得分:1)
基本上,我认为它们包含的信息完全相同。
但是,如果您拥有该术语的名称,并且在tf-idf矩阵中查找了该术语的列位置,那么您会使用.vocabulary_
。
.vocabulary_
的术语名称和值在tf-idf矩阵中的列位置作为关键字。
相反,如果您知道该术语在tf-idf矩阵中的列位置,并查找其名称,那么就选择.get_feature_names()
。
.get_feature_names()
中术语的位置对应于tf-idf矩阵中元素的列位置。