用pytesseract检测表的任何方法

时间:2019-03-07 06:03:02

标签: python python-tesseract

我试图从图像中提取表数据并插入到csv中。我通过tesseract使用

谁能告诉我如何从图像中检测表格数据

我有这张图片:

enter image description here

1 个答案:

答案 0 :(得分:0)

检查此开源库https://github.com/jsvine/pdfplumber。这在提取表数据中显示了良好的前景。您将在表格中以列表形式获得文本,这非常有用。除此之外,您还可以获得单元的坐标,这也为任何后处理提供了条件。

一个缺点是它仅适用于数字pdf。