我正在实施包含该行的gensim http://rare-technologies.com/deep-learning-with-word2vec-and-gensim/教程 sentence = word2vec.Text8Corpus('/ tmp / text8') 但是当我运行程序时,我得到text8不存在的错误。查看代码,我看到Text8Corpus是一个接受参数类型对象的方法。说明书表明应该通过
http://mattmahoney.net/dc/text8.zip
当我手动下载此文件并尝试传递生成的imbd未压缩数据集时,我被告知权限被拒绝。有没有人对这个问题有任何见解?我想我自己下载了imdb数据集还是假设在代码中有一些指针会自动执行?
答案 0 :(得分:5)
就像他在描述中所说,你需要下载文件并将其解压缩到/ tmp目录。你可以这样做:
wget http://mattmahoney.net/dc/text8.zip -P /tmp
unzip text8.zip
现在你应该没问题;)