如何改变Tfidf矢量的形状(csr_matrix)

时间:2016-05-09 05:36:07

标签: python numpy scipy scikit-learn

我有一堆文件,我从中创建了TfIdf矩阵(通过TfidfVectorizer)

vect = TfidfVectorizer(stop_words=get_stop_words(), lowercase=True, dtype=np.float32)
matrix = vect.fit_transform(list_of_documents)

之后我为用户创建了一些向量

user_vector = matrix[index_of_document]

我正在将用户向量与矩阵向量进行比较以找到相似之处。

cosine_similarities = linear_kernel(user_vector, matrix).flatten()

但我有一个问题。当一个新文档添加到这一堆我重新创建矩阵和它的形状更改,但用户矢量的形状仍然相同所以我不能再比较它。

有没有办法改变那些矢量的形状?

0 个答案:

没有答案