我正在尝试使用C#中的tesseract-ocr阅读YouTube某些文本。
我想使此过程尽快完成。
这是我目前实施的方式。
if(engine == null) engine = new TesseractEngine(@"./tessdata", "eng", EngineMode.Default);
engine.SetVariable("tessedit_char_whitelist", "AaBbCcDdEeFfGgHhIiJjKkLlMmNnOoPpQqRrSsTtUuVvWwXxYyZz0123456789"); // If digit on
using (var img = PixConverter.ToPix(Bmp))
{
using (var page = engine.Process(img))
{
string HOCRXML = page.GetHOCRText(1);
return HOCRXML;
}
}
我尝试过IronOCR,但它的执行速度似乎与之相似。
我可以使用哪些选项来使Tesseract实施更快?