标签: python pdf web-scraping
也许我还没有找到解决此问题的现有问题,但是我在以下URL上有一个PDF:http://labettecountykssheriff.org/plugins/show_image.php?id=3997,我正在尝试找出以某种方式抓取其内容的最佳方法具有统一性,以便可以将它们放入数据库中。
我已经尝试了PDFMiner TextConverter并查看了Tabula(尽管当我尝试用multi_tables = True调用read_pdf时可能做的并不正确,因为它返回了一个空列表)。