我有一堆文件,我从中创建了TfIdf矩阵(通过TfidfVectorizer)
vect = TfidfVectorizer(stop_words=get_stop_words(), lowercase=True, dtype=np.float32)
matrix = vect.fit_transform(list_of_documents)
之后我为用户创建了一些向量
user_vector = matrix[index_of_document]
我正在将用户向量与矩阵向量进行比较以找到相似之处。
cosine_similarities = linear_kernel(user_vector, matrix).flatten()
但我有一个问题。当一个新文档添加到这一堆我重新创建矩阵和它的形状更改,但用户矢量的形状仍然相同所以我不能再比较它。
有没有办法改变那些矢量的形状?