我正在使用Google的tesseract OCR(https://github.com/gali8/Tesseract-OCR-iOS)在我的iOS应用中执行图像到文本的转换。
我可以使用以下代码进行扫描并获取字符串。
let tesseract:G8Tesseract = G8Tesseract(language:"eng")
tesseract.delegate = self
tesseract.image = imageTaken // image taken from camera
tesseract.engineMode = .tesseractCubeCombined
tesseract.recognize()
print(tesseract.recognizedText)
它逐行扫描并检索文本。 (将其他段落的行混合)。这样。
图片1
现在,我如何才能将文本作为一个块,并分别从每个块中读取行。这样。
图片2
我尝试过的事情。
仍然将来自不同段落的行混合在一起,并将文本视为一行,如图1所示。
任何帮助将不胜感激。预先感谢。