使用表格分析PDF中的表格

时间:2018-07-24 14:29:02

标签: pandas tabula

在此感谢您的帮助。我正在尝试将表格从多页PDF解析为数据框。我能够使用表格提取表,然后使用基本的python切片重新排列数据。但是,这一次只能用于一页,因为表格不能正确地解释第二页的页眉(给出了一个错误消息,该错误消息期望x字段但找到y字段)。 我尝试使用表格形式的area function ='a,b,c,d',pages ='all',但是即使复制出坐标并将其粘贴到我的代码中也无法正常工作。我读到有一种方法可以使用PyPDF2查找页数,然后遍历该页数,但是我似乎无法解决。如前所述,下面的代码对于单个页面效果很好。干杯。

..././assembly/target/scala-2.11/jars' does not exist; make sure Spark is built.

0 个答案:

没有答案