标签: python header tabula
我正在尝试使用tabula-py从pdf中获取表格。 pdf中的表格没有网格线。当我尝试获取表时,标题丢失。例如,我有一个pdf如下。我的代码是从 医师和牙医340.2 350.3 365.8 359.4,我还需要标题2014、2015、2016、2017。
df = read_pdf('Denver.pdf', pages = 4, output_format= 'Csv',encoding='latin-1',pandas_options={'header': None})
screenshot of the pdf