tesseract - 使用Tesseract检测黑色背景上的白色字符

T. Kasar，J。Kumar和A. G. Ramakrishnan撰写的论文描述了该问题的一种解决方案：“字体和背景颜色独立文本二值化”。可以找到该论文here。 Jason Funk实现了该算法。他的实施可以找到here。我在算法上取得了一些成功。我认为这种解决方案正是您所寻找的。

您可能还会发现查看有关背景消除（OpenCV for OCR: How to compute thresholding levels for gray image OCR）及其答案的最近询问的问题会很有帮助。您可以通过背景颜色分离感兴趣的区域，然后将每个区域交给tesseract进行处理。或者，在二值化后，您可以在图像的黑色背景部分（或副图对比）中反转8x8像素区域（在上面的答案中描述），以创建统一的背景。

最后，您可以通过搜索车牌识别问题（或车牌）的解决方案找到一些有用的信息。许多车牌（牌照）具有可能干扰识别的背景图像或照明伪影。更普遍的问题是背景消除。

使用Tesseract检测黑色背景上的白色字符

1 个答案: