标签: python word2vec cosine-similarity phrase
我刚刚开始使用word2vec,我不知道如何创建两个不同文档集的向量(使用word2vec),document1包含一组单词和短语(列表列表),而document2仅包含短语。两个列表都有不同的长度。
例如:
file
我如何计算余弦相似度?我应该为document_list1中的所有句子创建矢量,然后为document_list2然后是余弦相似度创建矢量,还是应该为两个document_lists中的每个句子分别创建矢量?
任何帮助将不胜感激。