使用python阅读pdf中的两个表

时间:2019-12-13 10:07:59

标签: python pandas pdf tabula

我有一个带有两个侧面的pdf文档,其中有一个连续的表。

第一面和第二面: enter image description here

我想将其放入python中的数据框。我正在运行以下行:

from tabula import read_pdf
df = read_pdf("C:/.../20191212.pdf", pages=2)
df.head()

问题是输出看起来像: enter image description here

所以问题在于表是错误的,我希望第0行成为表头,并且最上面的第一个头中的文本应该已经分为行和列。

我该如何解决?这篇文章链接到tabula

0 个答案:

没有答案