我是NLP嵌入世界的新手。我使用了gensim的word2vec模型和tensorflow矢量表示。
我有一个问题,即在训练gensim的word2vec模型时,它需要使用标记化句子,而tensorflow需要很长的单词列表。它在培训方面有何不同。有质量影响吗? 那么tensorflow如何满足skip-gram的需要,因为现在数据是单词列表而不再是句子。 我指的是链接https://www.tensorflow.org/tutorials/word2vec
中的tensorflow教程如果我的理解得到澄清,如果我在这个领域的理解是错误的,那么请原谅我 感谢您的指导和帮助。