我使用了来自nuget的Tesseract库(3.2.0-alpha2)。我也玩旧版本和tessnet2库,并没有得到任何积极的结果。 对于样品,我有2张图片: multiple numbers single number
当我尝试识别多个号码时,我只收到号码'541'并且没有看到单个字符'0'的号码。当我尝试识别单个号码时,我也没有任何结果。
我的代码示例如下:
using (var engine = new TesseractEngine(@"tessdata/", "eng"))
{
engine.SetVariable("tessedit_char_whitelist", "0123456789");
using (var img = Pix.LoadFromFile(@"multiple_numbers.bmp"))
using (var page = engine.Process(img))
using (var iterator = page.GetIterator())
{
Console.WriteLine(page.GetText());
iterator.Begin();
do
{
var text = iterator.GetText(PageIteratorLevel.Word);
Console.WriteLine(int.Parse(text));
}
while (iterator.Next(PageIteratorLevel.Word));
}
}
我使用PageIteratorLevel作为迭代器,使用EngineMode作为引擎,使用PageSegMode进行处理 - 没有任何成功。请帮我解决我的问题。主要目标是从图像接收所有数字。如果我找到最简单的方法,我可以更改识别库。