让我通过一个例子来解释任务,
有一个名为demo1.jpeg的图像,上面写有整篇文章。它不是手写的。它是数字的。
我想要的是在该图像上找到特定单词的位置。像文本上的x,y坐标一样。
例如,如果我要在单词“ awesome”上找到每一个出现的单词,我都应该得到该单词所有出现的数组。
任何有关演示的建议将不胜感激。
谢谢。
答案 0 :(得分:2)
我正在使用Tesseract解决此问题。这可能会很有帮助。这是一个示例
PageIteratorLevel myLevel = PageIteratorLevel.Word;
TesseractEngine engine = new TesseractEngine("./tessdata", "eng");
var page = engine.Process(bitmap, PageSegMode.Auto);
using (var iter = page.GetIterator())
{
iter.Begin();
do
{
if (iter.TryGetBoundingBox(myLevel, out var rect))
{
var curText = iter.GetText(myLevel);
if (curText == "awesome") //Here is your text
{
//Get rect.X1, rect.Y1,
}
}
} while (iter.Next(myLevel));
}
希望对您有帮助