我已经使用pip install安装了textract,并在jupyter笔记本中运行了import命令,这会引发以下错误。
我在Windows计算机上,并使用conda安装了两个版本的python(2.7和3.6)。我还按照其他帖子中的建议添加了环境变量的路径,但仍然出现错误。
import textract
ImportErrorTraceback (most recent call last)
<ipython-input-2-99b3b0e1733d> in <module>()
1 #Code to extract pdf files
----> 2 import textract
3 text = textract.process("C:/Users/username/Documents/Projects/Attachments/PDF/fileA.pdf")
ImportError: No module named textract
编辑:
我仅在python 2.7上成功安装了textract。 我已经将以下路径添加到环境变量中 C:\ Users \ Username \ AppData \ Local \ Continuum \ anaconda3 \ envs \ mypy27 \ C:\ Users \ Username \ AppData \ Local \ Continuum \ anaconda3 \ envs \ mypy27 \ Scripts --->这是textract文件所在的位置 C:\ Users \ Username \ AppData \ Local \ Continuum \ anaconda3 \ envs \ mypy27 \ Lib \ lib-tk C:\ Users \ Username \ AppData \ Local \ Continuum \ anaconda3 \ envs \ mypy27 \ Lib C:\ Users \ Username \ AppData \ Local \ Continuum \ anaconda3 \ envs \ mypy27 \ DLLs
更新: 我使用pip install安装了pypdf2,并尝试将其导入到虚拟笔记本电脑中。它返回了相同的错误。我想知道我是否安装不正确。
答案 0 :(得分:1)
这对我在ubuntu上有用
1。打开终端
python -m venv env
source ./env/bin/activate
sudo apt update
sudo apt install python-pip && pip install --upgrade pip
sudo apt install python-dev libxml2-dev libxslt1-dev antiword unrtf poppler-utils pstotext tesseract-ocr flac ffmpeg lame libmad0 libsox-fmt-mp3 sox libjpeg-dev swig
pip install textract
如果您遇到其他错误:
尝试
pip install https://pypi.python.org/packages/ce/c7/ab6cd0d00ddf8dc3b537cfb922f3f049f8018f38c88d71fd164f3acb8416/SpeechRecognition-3.6.3-py2.py3-none-any.whl
sudo apt install libpulse-dev
pip install textract
现在您将能够导入textract
import textract
text = textract.process("/home/user/textract_test.pdf")
答案 1 :(得分:0)
这可能是一种解决方法。
1。卸载Anaconda并重新安装。
2。没有在anaconda中创建任何python 2.7环境,而是使用pip以及基本的anaconda命令提示符中的所有其他依赖项重新安装了textract。
3。尝试导入textract,它像一种魅力一样工作!