从图像

时间:2018-06-04 11:13:54

标签: python image ocr tesseract leptonica

我有image(有些信息是故意删除的)

我需要的是某种方法来删除文本周围的边框(线条)。

我正在对这些图像进行OCR,这些线条确实是文本识别的方式。

当有人上传文档时,一切都必须自动运行,OCR和所有其他脚本在服务器端执行。

2 个答案:

答案 0 :(得分:0)

您可以尝试使用Hough transform检测图像中的所有直线,然后您只需要屏蔽它们。

答案 1 :(得分:0)