如何使用Tabula-py

时间:2018-11-01 06:18:29

标签: python header tabula

我正在尝试使用tabula-py从pdf中获取表格。 pdf中的表格没有网格线。当我尝试获取表时,标题丢失。例如,我有一个pdf如下。我的代码是从 医师和牙医340.2 350.3 365.8 359.4,我还需要标题2014、2015、2016、2017。

df = read_pdf('Denver.pdf', pages = 4, output_format= 'Csv',encoding='latin-1',pandas_options={'header': None})

screenshot of the pdf

0 个答案:

没有答案