如何排除tesseract中的特殊字符?

时间:2016-05-09 09:21:14

标签: ios objective-c swift ocr tesseract

我正在使用tesseract和mcr.traineddata从支票中读取MICR数字。 这是我想要阅读的检查的一部分。

enter image description here

以下是从图像中检测到的文本部分。

enter image description here

我的问题是...... **如何从图像中排除特殊字符? 培训是否可以选择特殊字符? **

除了特殊字符外,其他数字都会被检测到。

我的代码

    let tesseract = G8Tesseract()
    tesseract.language = "mcr"
    tesseract.engineMode = .TesseractOnly
    tesseract.pageSegmentationMode = .Auto
    tesseract.maximumRecognitionTime = 60.0
    imageView.image = imageView.image?.g8_grayScale()
    imageView.image = imageView.image?.g8_blackAndWhite()    
    tesseract.image = imageView.image
    tesseract.recognize()

1 个答案:

答案 0 :(得分:0)

我创建了一个新的训练数据文件(my.traineddata)。我训练了特殊角色被识别为' X'。我们使用的图像越多,准确的训练数据文件。然后我们可以相应地操纵已识别的文本。