安装PDFlib文本提取工具的方法

时间:2013-09-13 10:44:34

标签: python pdf text-extraction

我从网站下载了PDFlib tar文件。我无法在ubuntu上安装它并将其配置为python。我是新手使用ubuntu。谁能告诉我安装PDFlib的方法? 我从这个链接下载了tar文件

http://www.pdflib.com/download/tet/

2 个答案:

答案 0 :(得分:1)

安装适用于Python的TET版本: Python扩展机制通过在运行时加载共享库来工作。为了使TET绑定起作用,Python解释器必须能够访问TET Python包装器,它将在PYTHONPATH环境变量中列出的目录中进行搜索。

TET Python包装器是你在下载的tarball中找到的tetlib_py.so(为你的python版本选择正确的一个)。除了tetlib_py.so之外,文件PDFLib / TET.py和PDFlib / init .py必须在同一目录中可用。

答案 1 :(得分:0)

python自带的包管理器叫做pip。尝试

  

pip install pypdflib

在命令行中。

另一种方法是使用ubuntu包管理器 - apt-get,aptitude,synaptic等... 检查ubuntu存储库中的包是否正确:

  

apt-cache search python pdflib

如果发现此类条目,请发出:

  

apt-get install“package name here”