我想建立一个可以将新闻分类到特定分类的模型。我想,我会将所有选定的火车纸张放入特定的标签类别,然后你将word2vec用于培训并生成模型?我不知道有可能吗? 我尝试了一些小例子来构建gensim中的词汇,但它一直告诉我这个词并不存在于词汇中。我很混淆。
randomTxt = 'loop is good. loop infinity is not good. they are good at some point.'
x = randomTxt.split() #This finds words in the document
a = Counter(x)
print x
w1 = 'so'
model1 = Word2Vec(randomTxt,min_count=0)
print model1.wv['loop']
我想知道是否有人有想法或知道如何从最初的数据集构建可以帮助我吗?或者也许一些文档是好的。 我已阅读此文档:https://radimrehurek.com/gensim/models/word2vec.html 但正如我上面所说,它一直告诉我循环在词汇word2vec build中不存在。