我正在开发Objective-C中的OCR应用程序。到目前为止,我的图像识别工作相当不错,但我有兴趣检测行/行,以获得更好,更好的结果。
我的项目中有tesseract库和leptonica库。我查看了baseapi.h的tesseract,我相信我要找的是名为
的函数 Boxa* GetTextlines(Pixa** pixa, int** blockids);
我不确定如何在我的项目中使用此功能或者它是否是我寻求的正确功能。任何人都可以就此事提供任何见解吗?
谢谢!
答案 0 :(得分:0)
检测页面元素(例如块,段落,行,单词等)的标准方法是使用PageIterator类。我不知道如何在Objective-C中做到这一点,但这里是C ++中的示例代码供参考:
tesseract::ResultIterator* ri = tess->GetIterator();
while (ri->Next(tesseract::RIL_LINE)) {
// Do whatever you want with that line
// Recognize line's text
char* ctext = ri->GetUTF8Text(tesseract::RIL_LINE);
// Get line's bounding box
ri->BoundingBox(tesseract::RIL_WORD, &left, &top, &right, &bottom);
}