应用错误收集

如何为短语创建word2vec，然后计算余弦相似度

时间：2019-04-12 06:35:51

标签： python word2vec cosine-similarity phrase

我刚刚开始使用word2vec，我不知道如何创建两个不同文档集的向量（使用word2vec），document1包含一组单词和短语（列表列表），而document2仅包含短语。两个列表都有不同的长度。

例如：

file

我如何计算余弦相似度？我应该为document_list1中的所有句子创建矢量，然后为document_list2然后是余弦相似度创建矢量，还是应该为两个document_lists中的每个句子分别创建矢量？

任何帮助将不胜感激。

0 个答案:

没有答案