应用错误收集

使用python阅读pdf中的两个表

时间：2019-12-13 10:07:59

标签： python pandas pdf tabula

我有一个带有两个侧面的pdf文档，其中有一个连续的表。

第一面和第二面：

我想将其放入python中的数据框。我正在运行以下行：

from tabula import read_pdf
df = read_pdf("C:/.../20191212.pdf", pages=2)
df.head()

问题是输出看起来像：

所以问题在于表是错误的，我希望第0行成为表头，并且最上面的第一个头中的文本应该已经分为行和列。

我该如何解决？这篇文章链接到tabula。

0 个答案:

没有答案