如何为短语创建word2vec,然后计算余弦相似度

时间:2019-04-12 06:35:51

标签: python word2vec cosine-similarity phrase

我刚刚开始使用word2vec,我不知道如何创建两个不同文档集的向量(使用word2vec),document1包含一组单词和短语(列表列表),而document2仅包含短语。两个列表都有不同的长度。

例如:

file

我如何计算余弦相似度?我应该为document_list1中的所有句子创建矢量,然后为document_list2然后是余弦相似度创建矢量,还是应该为两个document_lists中的每个句子分别创建矢量?

任何帮助将不胜感激。

0 个答案:

没有答案