ImportError:没有名为textract

时间:2018-06-20 17:26:09

标签: python packages importerror

我已经使用pip install安装了textract,并在jupyter笔记本中运行了import命令,这会引发以下错误。

我在Windows计算机上,并使用conda安装了两个版本的python(2.7和3.6)。我还按照其他帖子中的建议添加了环境变量的路径,但仍然出现错误。

import textract

ImportErrorTraceback (most recent call last)
<ipython-input-2-99b3b0e1733d> in <module>()
     1 #Code to extract pdf files
----> 2 import textract
    3 text = textract.process("C:/Users/username/Documents/Projects/Attachments/PDF/fileA.pdf")

ImportError: No module named textract 

编辑:

我仅在python 2.7上成功安装了textract。 我已经将以下路径添加到环境变量中 C:\ Users \ Username \ AppData \ Local \ Continuum \ anaconda3 \ envs \ mypy27 \ C:\ Users \ Username \ AppData \ Local \ Continuum \ anaconda3 \ envs \ mypy27 \ Scripts --->这是textract文件所在的位置 C:\ Users \ Username \ AppData \ Local \ Continuum \ anaconda3 \ envs \ mypy27 \ Lib \ lib-tk C:\ Users \ Username \ AppData \ Local \ Continuum \ anaconda3 \ envs \ mypy27 \ Lib C:\ Users \ Username \ AppData \ Local \ Continuum \ anaconda3 \ envs \ mypy27 \ DLLs

更新: 我使用pip install安装了pypdf2,并尝试将其导入到虚拟笔记本电脑中。它返回了相同的错误。我想知道我是否安装不正确。

2 个答案:

答案 0 :(得分:1)

这对我在ubuntu上有用

1。打开终端

python -m venv env 
source ./env/bin/activate
sudo apt update
sudo apt install python-pip && pip install --upgrade pip
sudo apt install python-dev libxml2-dev libxslt1-dev antiword unrtf poppler-utils pstotext tesseract-ocr flac ffmpeg lame libmad0 libsox-fmt-mp3 sox libjpeg-dev swig
pip install textract

如果您遇到其他错误:

尝试

pip install https://pypi.python.org/packages/ce/c7/ab6cd0d00ddf8dc3b537cfb922f3f049f8018f38c88d71fd164f3acb8416/SpeechRecognition-3.6.3-py2.py3-none-any.whl
sudo apt install libpulse-dev
pip install textract

现在您将能够导入textract

import textract
text = textract.process("/home/user/textract_test.pdf")

答案 1 :(得分:0)

这可能是一种解决方法。

1。卸载Anaconda并重新安装。

2。没有在anaconda中创建任何python 2.7环境,而是使用pip以及基本的anaconda命令提示符中的所有其他依赖项重新安装了textract。

3。尝试导入textract,它像一种魅力一样工作!