什么是('/ tmp / text8')gensim

时间:2016-03-22 16:43:33

标签: python gensim

我正在实施包含该行的gensim http://rare-technologies.com/deep-learning-with-word2vec-and-gensim/教程     sentence = word2vec.Text8Corpus('/ tmp / text8') 但是当我运行程序时,我得到text8不存在的错误。查看代码,我看到Text8Corpus是一个接受参数类型对象的方法。说明书表明应该通过

http://mattmahoney.net/dc/text8.zip

当我手动下载此文件并尝试传递生成的imbd未压缩数据集时,我被告知权限被拒绝。有没有人对这个问题有任何见解?我想我自己下载了imdb数据集还是假设在代码中有一些指针会自动执行?

1 个答案:

答案 0 :(得分:5)

就像他在描述中所说,你需要下载文件并将其解压缩到/ tmp目录。你可以这样做:

 wget http://mattmahoney.net/dc/text8.zip -P /tmp
 unzip text8.zip

现在你应该没问题;)