标签: python python-tesseract
我试图从图像中提取表数据并插入到csv中。我通过tesseract使用
谁能告诉我如何从图像中检测表格数据
我有这张图片:
答案 0 :(得分:0)
检查此开源库https://github.com/jsvine/pdfplumber。这在提取表数据中显示了良好的前景。您将在表格中以列表形式获得文本,这非常有用。除此之外,您还可以获得单元的坐标,这也为任何后处理提供了条件。
一个缺点是它仅适用于数字pdf。