Question

我正在使用tesseract和mcr.traineddata从支票中读取MICR数字。这是我想要阅读的检查的一部分。

以下是从图像中检测到的文本部分。

我的问题是...... **如何从图像中排除特殊字符？培训是否可以选择特殊字符？ **

除了特殊字符外，其他数字都会被检测到。

我的代码

    let tesseract = G8Tesseract()
    tesseract.language = "mcr"
    tesseract.engineMode = .TesseractOnly
    tesseract.pageSegmentationMode = .Auto
    tesseract.maximumRecognitionTime = 60.0
    imageView.image = imageView.image?.g8_grayScale()
    imageView.image = imageView.image?.g8_blackAndWhite()    
    tesseract.image = imageView.image
    tesseract.recognize()

Answer 1

我创建了一个新的训练数据文件（my.traineddata）。我训练了特殊角色被识别为＆＃39; X＆＃39;。我们使用的图像越多，准确的训练数据文件。然后我们可以相应地操纵已识别的文本。

如何排除tesseract中的特殊字符？

1 个答案: