我解析了3个文档以获取表。结果如下:
这些是当前的表格解析设置:
rows = tabula.read_pdf(filename,
pages='all',
silent=True,
pandas_options={
'header': None,
'error_bad_lines': False,
'warn_bad_lines': False
})
还有其他设置可以解决此特定问题。
答案 0 :(得分:0)
警告来自tabBox-java依赖的PDFBox。不幸的是,问题本身来自PDF本身,而无法通过tabula-py解决。