Question

我正在使用Google的tesseract OCR（https://github.com/gali8/Tesseract-OCR-iOS）在我的iOS应用中执行图像到文本的转换。

我可以使用以下代码进行扫描并获取字符串。

let tesseract:G8Tesseract = G8Tesseract(language:"eng")
        tesseract.delegate = self
        tesseract.image = imageTaken // image taken from camera
        tesseract.engineMode = .tesseractCubeCombined  
        tesseract.recognize()  
        print(tesseract.recognizedText)

它逐行扫描并检索文本。（将其他段落的行混合）。这样。

图片1

现在，我如何才能将文本作为一个块，并分别从每个块中读取行。这样。

图片2

我尝试过的事情。

print（tesseract.recognizedBlocks（by：.block））
print（tesseract.recognizedBlocks（by：.paragraph））

仍然将来自不同段落的行混合在一起，并将文本视为一行，如图1所示。

任何帮助将不胜感激。预先感谢。

iOS-如何使用tesseract OCR将文本识别为块

0 个答案: