我正在尝试计算向量矩阵和向量之间的余弦相似度。
我正在使用此功能:
matrix_example = [list([u'phase', u'nepal', u'formulation', u'workshop', u'janakpur', u'kamala', u'river', u'system', u'stakeholder', u'dhanusa']) list([u'ready', u'flood', u'myself', u'with', u'upcoming', u'interview', u'crack', u'video', u'escape', u'reality', u'life', u'bts_twt']) list([u'what', u'possibly', u'could', u'wrong', u'some', u'flood', u'some', u'storm', u'fire', u'trump', u'environment', u'chief', u'suggests', u'global'])]
vector_example = [u'evidently' u'that' u'blue' u'wave' u'calmed' u'blue' u'trickle' u'every' u'looking' u'more' u'more' u'like' u'tsunami']
def cos_matrix_multiplication(matrix, vector):
#Calculating pairwise cosine distance using matrix vector multiplication.
dotted = np.reshape(matrix.dot(vector))
matrix_norms = np.linalg.norm(matrix, axis=1)
vector_norm = np.linalg.norm(vector)
matrix_vector_norms = np.multiply(matrix_norms, vector_norm)
neighbors = np.divide(dotted, matrix_vector_norms)
return neighbors
但是,出现此错误是因为矩阵中的向量与我的inpu向量长度不同。
ValueError: shapes (13,) and (11,) not aligned: 13 (dim 0) != 11 (dim 0)
我发现了一些响应,以便处理不同长度的向量,但是我无法将其应用于向量矩阵。我处理了大量的数据,要通过向量对进行处理将很长。