Gensim:正在使用慢速版本的gensim.models.doc2vec

时间:2017-06-09 15:32:12

标签: python numpy scipy pip gensim

我的设置如下:

Python版本:3.6.0

Numpy版本:1.13.0

Scipy版本:0.19.0

Gensim版本:2.1.0

GCC编译器版本:5.3.0

系统:Windows 7,64位

我在上面的设置中出现以下错误

import gensim
>>>Slow version of gensim.models.doc2vec is being used

这使得在gensim上训练模型时运行时间太慢。我觉得我使用的软件包版本或我如何安装它们有一些问题,因为:我必须使用pip安装numpy;我不得不使用conda安装scipy;我不得不再次使用pip安装gensim。这个设置的原因是因为如果我尝试使用pip安装scipy,我会收到错误

>>>ImportError: DLL load failed: The specified procedure could not be found.

所以我必须通过conda安装scipy。另外,如果我尝试使用

安装gensim

conda install gensim

conda update gensim

它只安装版本1 - 我尝试了conda install -c anaconda gensim=2.1.0但是我收到了错误

PackageNotFoundError: Package missing in current win-64 channels:
- gensim 2.1.0*

当我将它们导入脚本时,Numpy和Scipy可以独立工作 - 也就是说,它们导入正常,我可以使用它们的所有功能。然而,当他们被Gensim使用时,显然存在问题,我不知道为什么。

是否有人能够建议可能的修复方法?理想情况下,如果可能的话,我想保留这些软件包的所有最新版本。提前谢谢

注意:Gensim可以正常使用"快速"我安装了Gensim版本1并且上面使用相同版本的依赖项时的版本!

2 个答案:

答案 0 :(得分:2)

我也有这个问题(我正在运行ubuntu)。 我发现如果我直接使用github的版本,问题就解决了。

所以有两个解决方案:(首先使用pip uninstall gensim卸载gensim)

  • 从gensim的github page下载并解压缩gensim zip文件,然后将CD解压缩到zip内容的文件夹并运行命令 python setup.py install
  • 运行此命令pip install git+https://github.com/RaRe-Technologies/gensim@master#egg=gensim

我使用了第二个,现在我没有收到警告

答案 1 :(得分:1)

问题在于某些底层软件包不是最新的。 Here我找到了适合我的答案,简而言之:

卸载Gensim

sudo pip3 uninstall gensim

安装python3-dev build-essential

sudo apt-get install python3-dev build-essential  

重新安装Gensim

sudo pip3 install --upgrade gensim

注意:

上述说明适用于使用pip和apt-get管理包的系统 pip3是pip的python3版本