使用Tessearact OCR读取错误

时间:2015-06-29 16:35:38

标签: opencv ocr tesseract

我使用Tesseract OCR进行文本阅读。我的二进制图像是清晰的,但是当OCR读取图像时,读取时出错。实际数字是05820,但它被读作05320.非常清晰和清晰的图像有错误,实施中可能出错? 我附上了我用过的图像和Tessearact代码。

     ![enter image description here][1]int OCR::textRecognition(void){
        tesseract::TessBaseAPI tess;
        tess.Init(NULL, "eng", tesseract::OEM_DEFAULT);
        tess.SetPageSegMode(tesseract::PSM_SINGLE_BLOCK);

        tess.SetImage((uchar*)extText.data, extText.cols, extText.rows, 1, extText.cols);
        // Get the text
        char* out = tess.GetUTF8Text();
        std::cout << out << std::endl;
        return SUCCESS;
    }

enter image description here

1 个答案:

答案 0 :(得分:2)

尝试使用您计划使用的字体训练tesseract。它应该大大提高精度。您可以使用SerakTesseractTrainer执行此操作。 这是youtube教程:http://www.youtube.com/watch?v=47rgBL9NZkM