word2vec vocab vs char

时间:2017-07-14 15:18:21

标签: python word2vec

我正在使用word2vec将我的单词表示为向量。

text = np.loadtxt("file.txt", dtype=str, delimiter=" ")
word2vec = w2v.Word2Vec(text, size=100, window=5, min_count=5, workers=4)
print(len(word2vec.wv.vocab))

text是单词(字符串)的列表。此代码不打印单词数,而是打印26个#英文字母。为了训练word2vec到我的模型,我需要处理单词,而不是字母。我已经尝试将文本转换为字符串,但它没有成功。我做错了什么?

1 个答案:

答案 0 :(得分:0)

我相信你需要传递一系列单词列表:

word2vec = w2v.Word2Vec(text.reshape(-1, 1), size=100, window=5, min_count=5, workers=4)