我希望通过使用sklenrn的tfidf方法获取文本的关键字
我有tfidf模块,请参阅下面的代码:
from sklearn.feature_extraction import text
tfidf_vect = text.TfidfVectorizer()
texts = get_text_list()
tfidf = tfidf_vect.fit_transform(texts)
现在,输入新文档作为文本
res = tfidf_vect.transform(text)
res是csr_matrix。 res.indices是单词的位置,res.data是tfidf值。
如何按res.data
对此res进行排序参考:http://www.cs.duke.edu/courses/spring14/compsci290/assignments/lab02.html