在Word2vec中,我们可以使用单词代替句子来进行模型训练
像下面的代码gberg_sents一样是句子标记 模型= Word2Vec(句子= gberg_sents,大小= 64,sg = 1,窗口= 10,最小计数= 5,种子= 42,工人= 8)
像这样我们也可以使用单词令牌
答案 0 :(得分:1)
否,word2vec是受语言建模目标训练的,即它可以预测在其他单词周围出现的单词。为此,您的训练数据必须是实际的句子,以显示在上下文中如何使用这些单词。实际上,单词的上下文为您提供了嵌入中捕获的信息。