标签: python image ocr tesseract leptonica
我有image(有些信息是故意删除的)
我需要的是某种方法来删除文本周围的边框(线条)。
我正在对这些图像进行OCR,这些线条确实是文本识别的方式。
当有人上传文档时,一切都必须自动运行,OCR和所有其他脚本在服务器端执行。
答案 0 :(得分:0)
您可以尝试使用Hough transform检测图像中的所有直线,然后您只需要屏蔽它们。
答案 1 :(得分:0)
您可以使用Leptonica删除线条。
http://www.leptonica.com/line-removal.html https://github.com/DanBloomberg/leptonica/blob/master/prog/lineremoval_reg.c