Tesseract(tessnet2)无法读取简单的数字

时间:2017-09-05 15:11:18

标签: c# ocr tesseract tessnet2

我设计了一个简单的代码,用于从图像中提取文本。 图像仅包含数字。这是我要转换的图像:

First image

Second image

Third image

OCR转换的结果总是〜

对于这两张图片,OCR转换结果有一些错误:

First picture with "successful" conversion - Result: "[1479502352"

Second picture with "successful" conversion - Result: "[1479502459"

这是我的代码:

    using Tes = tessnet2;

    private const string TesIni = @"C:\Program Files (x86)\Tesseract\tessdata";

    static void Main(string[] args)
    {
        System.Drawing.Bitmap TextImg = new System.Drawing.Bitmap(@"C:\HomeC\RPA_Prozesse\BOB_NPM_Retour\btnImages\TestTextImage.png");
        Tes.Tesseract ocr = new Tes.Tesseract();
        ocr.Init(TesIni, "eng", true);
        System.Collections.Generic.List<Tes.Word> Result = ocr.DoOCR(TextImg, System.Drawing.Rectangle.Empty);
        foreach(Tes.Word wrd in Result)
        {
            System.Console.WriteLine(wrd.Text);
        }

        System.Console.WriteLine("Application finished. Press any key to exit...");
        System.Console.ReadLine();
    }

在编写的文档中,“Tesseract”是最好的开源OCR-Library,而Google几乎没有改进 - 但结果极差。

是否有一些设置,我可以改变以获得更好的效果?

0 个答案:

没有答案