表格式无边界表格提取

时间:2018-07-17 09:04:02

标签: python-3.x pdftotext tabula

有人可以建议我如何使用python / java程序从pdf文件中的以下无边界表中提取PDF表格数据吗?

enter image description here

2 个答案:

答案 0 :(得分:1)

此表对于tabla可能很难。如何使用guess=False, stream=True

答案 1 :(得分:0)

可能有帮助

import tabula
df = tabula.read_pdf("nar_2021_editorial-3.pdf", pages="all", guess=False, stream=True)