iOS-如何使用tesseract OCR将文本识别为块

时间:2018-11-12 12:07:14

标签: ios swift ocr tesseract text-recognition

我正在使用Google的tesseract OCR(https://github.com/gali8/Tesseract-OCR-iOS)在我的iOS应用中执行图像到文本的转换。

我可以使用以下代码进行扫描并获取字符串。

let tesseract:G8Tesseract = G8Tesseract(language:"eng")
        tesseract.delegate = self
        tesseract.image = imageTaken // image taken from camera
        tesseract.engineMode = .tesseractCubeCombined  
        tesseract.recognize()  
        print(tesseract.recognizedText)

它逐行扫描并检索文本。 (将其他段落的行混合)。这样。

图片1

enter image description here

现在,我如何才能将文本作为一个块,并分别从每个块中读取行。这样。

图片2

enter image description here

我尝试过的事情。

  • print(tesseract.recognizedBlocks(by:.block))
  • print(tesseract.recognizedBlocks(by:.paragraph))

仍然将来自不同段落的行混合在一起,并将文本视为一行,如图1所示。

任何帮助将不胜感激。预先感谢。

0 个答案:

没有答案