我一直在研究PyTesseract OCR,并将PDF转换为JPEG,以便对图像进行OCR。图像的一部分具有黑色背景和白色文本,Tesseract无法识别该文本,而我图像的所有其他部分都被很好地读取。有没有办法改变具有黑色背景的图像的一部分?我尝试了一些SO资源,但似乎无济于事。 我正在使用Python 3,Open CV版本4和PyTesseract
答案 0 :(得分:0)
opencv具有按位反转功能,可以正确反转图像
您可以在图像的其余部分(已经正确的部分)上放置遮罩/冻结,并使用类似以下的方法:
imageWithMask = cv2.bitwise_not(imageWithMask)
或者,您也可以对图像的副本执行操作,并且仅复制所需的部分/像素/区域。...