如何使用python打印.pdf文件中的表格

时间:2018-12-13 06:18:16

标签: python pdf-extraction

  

CalledProcessError:命令'['java','-Dfile.encoding = UTF8','-jar','C:\ Users \ vijv2c13136 \ AppData \ Local \ Continuum \ anaconda2 \ lib \ site-packages \ tabula \ tabula-1.0.2-jar-with-dependencies.jar”,“-pages”,“ all”,“-guess”,“-format”,“ JSON”,“ TONY.pdf”]'返回非-零退出状态2

当我尝试在.pdf文件中打印表格时。它显示了此特定错误。

from tabula import wrapper

print(wrapper.read_pdf("TONY.pdf", multiple_tables=True,pages="all")

这是我提取.pdf文件表的代码。但是,当我尝试打印时,它显示了以上错误。

1 个答案:

答案 0 :(得分:0)

一种在pandas数据框中写入表格然后保存的方式。 (甚至显示了它)

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

fig, ax = plt.subplots()
fig.patch.set_visible(False)
ax.axis('off')
ax.axis('tight')

df = pd.DataFrame(np.random.randn(10, 4), columns=list('ABCD'))

ax.table(cellText=df.values, colLabels=df.columns, loc='center')

fig.tight_layout()

plt.show()

plt.savefig("tablepdf.pdf", bbox_inches='tight')

enter image description here