Tesseract OCR for Tamil没有迅速工作

时间:2015-03-31 11:11:55

标签: ios objective-c iphone swift tesseract

我使用tesseract为英语和泰米尔语。它在Swift中完美地用于英语。我可以看到在tessdata文件夹中有很多英文文件,像enlgish.cube.nn,english.cube.lm等文件。但是我找不到类似泰米尔语的文件。我只有这个tam.traineddata文件。我从Google Code下载了所有文件。所有文件都是最新的。 appStore中有一些应用程序从图像中提取泰米尔语文本。我不知道人们是怎么做的。

当我将泰米尔语文本包含的图像传递给Tesseract时,我得到的错误就像没有像tam.cube.lm,tam.cube.size..etc这样的文件。我在互联网上搜索了很多,但我找不到泰米尔语的文件。

请帮帮我,在哪里可以找到这些文件。?

以下给出的代码 - >

import UIKit

protocol ValueFromTesseractProtocol
{
    func textRecognizedFromImage(text : String, booleanValue : Bool)
}

class TesseractModel: NSObject
{
    var delegate : ValueFromTesseractProtocol!

    //MARK: - Creating sharedInstance

    class var sharedInstance: TesseractModel {

        struct Static {

            static var sharedInstance: TesseractModel?
            static var token: dispatch_once_t = 0
        }

        dispatch_once(&Static.token) {
            Static.sharedInstance = TesseractModel()
        }

        return Static.sharedInstance!
    }

    //MARK: - imageRecognition

    func imageRecognition(image : UIImage)
    {
        let tesseract = G8Tesseract()
        tesseract.language = "eng+tam"
        tesseract.engineMode = G8OCREngineMode.CubeOnly
        tesseract.maximumRecognitionTime = 60.0
        tesseract.pageSegmentationMode = G8PageSegmentationMode.Auto
        tesseract.image = image.g8_blackAndWhite()
        tesseract.recognize()

        if let recognizedText  = tesseract.recognizedText
        {
            // Call delegate - Pass value

            self.delegate.textRecognizedFromImage(recognizedText, booleanValue: true)
        }
        else
        {
            // Call delegate - Nil Value
            self.delegate.textRecognizedFromImage("", booleanValue: false)

        }
    }
}

0 个答案:

没有答案