用word2vec判断句子相似度

时间:2018-04-01 18:46:14

标签: machine-learning text-mining

如果我有一个句子列表,如何使用word2vec获得每对句子的相似度?此外,对于句子相似性,使用word2vec比其他方法更好,例如余弦相似度?

1 个答案:

答案 0 :(得分:1)

如果我没记错的话,word2vec会生成从单词到向量的向量映射,但不会为更大的结构(如句子)提出向量表示。为了找到两个句子之间的相似性,你需要从每个句子中的单词的向量表示到每个句子本身的向量表示。从那里你可以使用通常的矢量距离度量(余弦相似度,计算机作为归一化向量的点积)来比较它们。

由你决定如何将单词向量组合成句子向量,但一种简单的方法是将单词向量加在一起。