我有一个包含一行和标签的图表。我想使用Tesseract OCR来检测标签A,B,C,D,E的位置
https://ibb.co/eEQWxS(我是S.O.的新手所以无法发布图片)
这是我的代码:
var testImagePath = @"test.png";
using (var engine = new TesseractEngine(@"./tessdata", "eng", EngineMode.TesseractAndCube))
{
engine.SetVariable("tessedit_char_whitelist", "ABCDE");
engine.DefaultPageSegMode = PageSegMode.SingleBlock;
using (var img = Pix.LoadFromFile(testImagePath))
{
using (var page = engine.Process(img))
{
var text = page.GetHOCRText(0);
}
}
}
它没有用,Tesseract对这条线感到困惑。有没有办法忽略这一行,只是提取字母?