标签: ocr tesseract
我遇到了Tesseract 3.04的一些问题
Here是我们遇到问题的一个例子。这个例子模仿了我们在用阈值预处理图像后遇到的边缘情况。
在示例图像上运行tesseract工作得很好,但是当上面的案例是一个更大的图像的一部分时,我们遇到了问题,图像主要是黑色的白色文本,一个小区域包含白色的黑色文本。使用该示例,tesseract只能看到1234567.
我已经尝试了所有页面分割模式和所有OCR引擎模式。有没有人有任何想法让这项工作?