标签: python pandas pdf tabula
我有一个带有两个侧面的pdf文档,其中有一个连续的表。
第一面和第二面:
我想将其放入python中的数据框。我正在运行以下行:
from tabula import read_pdf df = read_pdf("C:/.../20191212.pdf", pages=2) df.head()
问题是输出看起来像:
所以问题在于表是错误的,我希望第0行成为表头,并且最上面的第一个头中的文本应该已经分为行和列。
我该如何解决?这篇文章链接到tabula。