Tabula Py无法检测PDF中的表格

时间:2019-01-06 19:14:55

标签: python pdf image-processing tabula

我使用了以下代码,但未检测到任何东西。我也尝试了其他各种PDF格式,但是得到了相同的结果。

from tabula import read_pdf,convert_into

df=read_pdf("1415_048.pdf",output_format="dataframe",encoding='utf-8',java_options=None,multiple_tables=True)

PDF看起来像这样 enter image description here

[] #This is the result I'm getting 

1 个答案:

答案 0 :(得分:2)

tabula-py基于tabula-java。而且仅适用于基于文本的PDF。

根据tabula.app网站https://tabula.technology/

  

注意:Tabula仅适用于基于文本的PDF,不适用于扫描的文档。