我正在使用Gensim包装器获取wordRank嵌入(我跟随他们tutorial执行此操作),如下所示。
from gensim.models.wrappers import Wordrank
model = Wordrank.train(wr_path = "models", corpus_file="proc_brown_corp.txt",
out_name= "wr_model")
model.save("wordrank")
model.save_word2vec_format("wordrank_in_word2vec.vec")
但是,我收到以下错误FileNotFoundError: [WinError 2] The system cannot find the file specified
。我只是想知道我做错了什么,因为一切看起来都对我不对。请帮帮我。
此外,我想知道我保存模型的方式是否正确。我看到Gensim提供了方法save_word2vec_format
。没有直接使用原始的wordRank模型,使用它有什么好处?
答案 0 :(得分:0)
FileNotFoundError: [WinError 2] The system cannot find the file specified
。
所以,我要在这里假设您已经追溯了
model = Wordrank.train(wr_path = "models", corpus_file="proc_brown_corp.txt",
out_name= "wr_model")
看到,wr_path应该指向您安装了wordrank的位置,更具体地说,指向您的wordrank二进制文件所在的文件夹的路径。
我的名字是path_to_wordrank_binary ='/home/ubuntu/wordrank'
,其中wordrank是包含wordrank.cpp的文件夹
然后确保您的语料库文件在当前目录中。既然那就是你给的。
This是您应该研究的教程。