获取“ __init __()得到了意外的关键字参数'document'”,python中的此错误,我正在使用Word2Vec和gensim

时间:2018-11-07 18:49:46

标签: python gensim word2vec

我正在使用Word2vec和gensim开发项目,

model = gensim.models.Word2Vec(
    documents = 'userDataFile.txt',
    size=150,
    window=10,
    min_count=2,
    workers=10)
model = gensim.model.Word2Vec.load("word2vec.model")
model.train(documents, total_examples=len(documents), epochs=10)
model.save("word2vec.model")

这是我目前拥有的零件代码,我在

下遇到此错误
Traceback (most recent call last):
File "C:\Users\User\Desktop\InstaSubProject\templates\HashtagData.py", line

37, in <module>
workers=10)
TypeError: __init__() got an unexpected keyword argument 'documents'

UserDataFile.txt是我存储从网络抓取中获得的输出结果数据的文件。

我不确定我要在这里解决什么。

提前谢谢!

4 个答案:

答案 0 :(得分:27)

今年是 2021 年,如果您出于与我相同的原因来到这里,那是因为您在 size 参数上遇到了相同的错误。

您需要改用 vector_size

答案 1 :(得分:1)

__init__()是Word2Vec的类构造函数,当您使用gensim.models.Word2Vec()实例化该类时,可能实际上不需要参数documents

尝试以下方法:

model = gensim.models.Word2Vec(
    size=150,
    window=10,
    min_count=2,
    workers=10)

答案 2 :(得分:1)

使用vector_size代替大小强文本

# creating a word to vector model
model_w2v = gensim.models.Word2Vec(
            tokenize_data,
            vector_size=200)

答案 3 :(得分:0)

看起来该模型在初始化时没有采用关键字参数documents。我认为您可以尝试以下任一方法来代替您的documents=语句:

corpus_file = 'userDataFile.txt'

sentences = # your iterable of sentences here

取决于您使用的格式