正如camelot所述,我们可以从特定区域提取表格,例如:
tables = camelot.read_pdf('table_regions.pdf', table_regions=['170,370,560,270'])
但是我怎么能找到我的pdf文件的这些区域。
答案 0 :(得分:0)
答案 1 :(得分:0)
我知道这是一个较晚的答复-但我刚遇到一个可能的解决方案。
如果您正在寻找一种自动提取方法,则可以在第一步中使用lattice
,用tables[0]._bbox
检索表边界,并在第二次调用{{1}时使用这些数字}放入参数camelot.read_pdf()
。
请注意,对于bbox来说,它们的格式很奇怪。