Gensim WordRank嵌入中的问题

时间:2017-10-27 08:11:23

标签: python nlp gensim word-embedding

我正在使用Gensim包装器获取wordRank嵌入(我跟随他们tutorial执行此操作),如下所示。

from gensim.models.wrappers import Wordrank

model = Wordrank.train(wr_path = "models", corpus_file="proc_brown_corp.txt", 
out_name= "wr_model")

model.save("wordrank")
model.save_word2vec_format("wordrank_in_word2vec.vec")

但是,我收到以下错误FileNotFoundError: [WinError 2] The system cannot find the file specified。我只是想知道我做错了什么,因为一切看起来都对我不对。请帮帮我。

此外,我想知道我保存模型的方式是否正确。我看到Gensim提供了方法save_word2vec_format。没有直接使用原始的wordRank模型,使用它有什么好处?

1 个答案:

答案 0 :(得分:0)

FileNotFoundError: [WinError 2] The system cannot find the file specified

所以,我要在这里假设您已经追溯了

model = Wordrank.train(wr_path = "models", corpus_file="proc_brown_corp.txt", 
out_name= "wr_model")

看到,wr_path应该指向您安装了wordrank的位置,更具体地说,指向您的wordrank二进制文件所在的文件夹的路径。

我的名字是path_to_wordrank_binary ='/home/ubuntu/wordrank',其中wordrank是包含wordrank.cpp的文件夹

然后确保您的语料库文件在当前目录中。既然那就是你给的。

This是您应该研究的教程。