什么是文档向量,Doc2Vec中的paraghaph id

时间:2016-06-21 04:47:58

标签: python gensim doc2vec

我正在阅读一篇关于doc2vec的论文。 但我真的不知道段落ID是什么以及它是如何训练的......

我尝试用gensim包实现情感分析任务并成功,但不知道它是如何工作的......

该论文称,文档向量的训练就像另一个词。但它是如何处理的?是否通过word2vec培训同时进行培训?如果它被视为单词,它如何包含段落的消息? 什么是句子标签和最让我困惑的是矩阵D ......

有人可以向我解释这个过程吗? 我完全搞砸了......请帮帮我... thx

0 个答案:

没有答案