我正在使用word2vec将我的单词表示为向量。
text = np.loadtxt("file.txt", dtype=str, delimiter=" ")
word2vec = w2v.Word2Vec(text, size=100, window=5, min_count=5, workers=4)
print(len(word2vec.wv.vocab))
text是单词(字符串)的列表。此代码不打印单词数,而是打印26个#英文字母。为了训练word2vec到我的模型,我需要处理单词,而不是字母。我已经尝试将文本转换为字符串,但它没有成功。我做错了什么?
答案 0 :(得分:0)
我相信你需要传递一系列单词列表:
word2vec = w2v.Word2Vec(text.reshape(-1, 1), size=100, window=5, min_count=5, workers=4)