word2vec模型可以用于单词也可以用作训练数据而不是句子

时间:2019-04-30 03:57:24

标签: word2vec natural-language-processing

在Word2vec中,我们可以使用单词代替句子来进行模型训练

像下面的代码gberg_sents一样是句子标记 模型= Word2Vec(句子= gberg_sents,大小= 64,sg = 1,窗口= 10,最小计数= 5,种子= 42,工人= 8)

像这样我们也可以使用单词令牌

1 个答案:

答案 0 :(得分:1)

否,word2vec是受语言建模目标训练的,即它可以预测在其他单词周围出现的单词。为此,您的训练数据必须是实际的句子,以显示在上下文中如何使用这些单词。实际上,单词的上下文为您提供了嵌入中捕获的信息。