Tesseract:识别C#中的简单数字

时间:2016-12-14 23:13:48

标签: c# ocr tesseract image-recognition

我使用了来自nuget的Tesseract库(3.2.0-alpha2)。我也玩旧版本和tessnet2库,并没有得到任何积极的结果。 对于样品,我有2张图片: multiple numbers single number

当我尝试识别多个号码时,我只收到号码'541'并且没有看到单个字符'0'的号码。当我尝试识别单个号码时,我也没有任何结果。

我的代码示例如下:

        using (var engine = new TesseractEngine(@"tessdata/", "eng"))
        {
            engine.SetVariable("tessedit_char_whitelist", "0123456789");

            using (var img = Pix.LoadFromFile(@"multiple_numbers.bmp"))
            using (var page = engine.Process(img))
            using (var iterator = page.GetIterator())
            {
                Console.WriteLine(page.GetText()); 
                iterator.Begin();

                do
                {
                    var text = iterator.GetText(PageIteratorLevel.Word);
                    Console.WriteLine(int.Parse(text));
                }
                while (iterator.Next(PageIteratorLevel.Word));
            }
        }

我使用PageIteratorLevel作为迭代器,使用EngineMode作为引擎,使用PageSegMode进行处理 - 没有任何成功。请帮我解决我的问题。主要目标是从图像接收所有数字。如果我找到最简单的方法,我可以更改识别库。

0 个答案:

没有答案