我正在使用pandas管道开发tf-idf。我正在使用SMART表示法中的lnc.ltc
加权方案。
query = 'some string'
pipeline = Pipeline([
('vect', CountVectorizer(stop_words='english')),
('tfidf', TfidfTransformer(norm='l2', use_idf=False, smooth_idf=False, sublinear_tf=True)),
])
doc_vectors = pipeline.fit_transform(data).toarray()
query_vector = pipeline.transform([query]).toarray()
对于文档向量,我想设置use_idf=False
。但是如何为查询向量设置use_idf=True
?
我尝试直接更改use_idf
参数,但不起作用。