如何找到骆驼的表区域

时间:2019-09-20 09:00:51

标签: python-camelot

正如camelot所述,我们可以从特定区域提取表格,例如:

tables = camelot.read_pdf('table_regions.pdf', table_regions=['170,370,560,270'])

但是我怎么能找到我的pdf文件的这些区域。

2 个答案:

答案 0 :(得分:0)

您可以通过一些视觉调试来检测此区域。

https://camelot-py.readthedocs.io/en/master/user/advanced.html#visual-debugging

答案 1 :(得分:0)

我知道这是一个较晚的答复-但我刚遇到一个可能的解决方案。

如果您正在寻找一种自动提取方法,则可以在第一步中使用lattice,用tables[0]._bbox检索表边界,并在第二次调用{{1}时使用这些数字}放入参数camelot.read_pdf()

请注意,对于bbox来说,它们的格式很奇怪。