我想根据字体大小拆分PDF文档,但是我无法找到可以同时提取字体大小和分割的库。
https://github.com/jsvine/pdfplumber可以提取字体大小,字符位置等信息。
pyPdf可以分割PDF文档,如果提供了坐标,可以保存在另一个pdf中,但没有提取字体大小和其他功能的机制。
我尝试过一起使用它们,但pdfplumber给出的字符位置与pyPdf使用的坐标不同。这就是我得到意想不到的输出的原因。
python中有没有可以同时执行这两个库的库?或者我有什么方法可以使用pdfplumber在pypdf中提供的位置?