使用python将pdf文档基于字体大小裁剪成多个pdf

时间:2018-05-23 06:35:17

标签: python pdf

我想根据字体大小拆分PDF文档,但是我无法找到可以同时提取字体大小和分割的库。

https://github.com/jsvine/pdfplumber可以提取字体大小,字符位置等信息。

pyPdf可以分割PDF文档,如果提供了坐标,可以保存在另一个pdf中,但没有提取字体大小和其他功能的机制。

我尝试过一起使用它们,但pdfplumber给出的字符位置与pyPdf使用的坐标不同。这就是我得到意想不到的输出的原因。

python中有没有可以同时执行这两个库的库?或者我有什么方法可以使用pdfplumber在pypdf中提供的位置?

0 个答案:

没有答案