如何使用Tesseract改善结果识别?

时间:2016-07-20 07:05:36

标签: c# ocr tesseract text-recognition

我正在使用图片

enter image description here

我想识别它的数字

var engine = new TesseractEngine(@"./tessdata", "eng", EngineMode.TesseractOnly);
engine.SetVariable("tessedit_char_whitelist", "0123456789");
var img = Pix.LoadFromFile(@"D:/Ex.png");
var page = engine.Process(img);
var text = page.GetText();
Console.Write("Press any key to continue . . . ");
Console.ReadKey(true);

结果非常糟糕31 3 963 如何改进?

1 个答案:

答案 0 :(得分:0)

您可以使用替换eng的pic训练自己的tessdata文件。 从github下载tesseract-ocr的源代码(https://github.com/tesseract-ocr/tesseract),and阅读wiki(https://github.com/tesseract-ocr/tesseract/wiki/Training-Tesseract-3.00 - 3.02),它可以帮助您训练您的tessdata。 希望它有所帮助。