我正在使用Word2vec和gensim开发项目,
model = gensim.models.Word2Vec(
documents = 'userDataFile.txt',
size=150,
window=10,
min_count=2,
workers=10)
model = gensim.model.Word2Vec.load("word2vec.model")
model.train(documents, total_examples=len(documents), epochs=10)
model.save("word2vec.model")
这是我目前拥有的零件代码,我在
下遇到此错误Traceback (most recent call last): File "C:\Users\User\Desktop\InstaSubProject\templates\HashtagData.py", line 37, in <module> workers=10) TypeError: __init__() got an unexpected keyword argument 'documents'
UserDataFile.txt
是我存储从网络抓取中获得的输出结果数据的文件。
我不确定我要在这里解决什么。
提前谢谢!
答案 0 :(得分:27)
今年是 2021 年,如果您出于与我相同的原因来到这里,那是因为您在 size
参数上遇到了相同的错误。
您需要改用 vector_size
。
答案 1 :(得分:1)
__init__()
是Word2Vec的类构造函数,当您使用gensim.models.Word2Vec()
实例化该类时,可能实际上不需要参数documents
尝试以下方法:
model = gensim.models.Word2Vec(
size=150,
window=10,
min_count=2,
workers=10)
答案 2 :(得分:1)
使用vector_size代替大小强文本
# creating a word to vector model
model_w2v = gensim.models.Word2Vec(
tokenize_data,
vector_size=200)
答案 3 :(得分:0)
看起来该模型在初始化时没有采用关键字参数documents
。我认为您可以尝试以下任一方法来代替您的documents=
语句:
corpus_file = 'userDataFile.txt'
或
sentences = # your iterable of sentences here
取决于您使用的格式