以下是示例代码。我试图获取newfile.txt中所有单词的向量表示(文件有新闻文章)。想知道model.getVectors()。keys()是否输出所有键(文件中的不同单词)或是否将输出限制为特定数字。
目前我只得到几个字作为关键,虽然我的输入有很多。它是如何工作的?
doc = sc.textFile('newfile.txt').map(lambda line: line.split(" "))
model = Word2Vec().fit(doc)
model.getVectors().keys()