Question

正如camelot所述，我们可以从特定区域提取表格，例如：

tables = camelot.read_pdf('table_regions.pdf', table_regions=['170,370,560,270'])

但是我怎么能找到我的pdf文件的这些区域。

Answer 1

您可以通过一些视觉调试来检测此区域。

Answer 2

我知道这是一个较晚的答复-但我刚遇到一个可能的解决方案。

如果您正在寻找一种自动提取方法，则可以在第一步中使用lattice，用tables[0]._bbox检索表边界，并在第二次调用{{1}时使用这些数字}放入参数camelot.read_pdf()。

请注意，对于bbox来说，它们的格式很奇怪。