我使用tesseract为英语和泰米尔语。它在Swift中完美地用于英语。我可以看到在tessdata文件夹中有很多英文文件,像enlgish.cube.nn,english.cube.lm等文件。但是我找不到类似泰米尔语的文件。我只有这个tam.traineddata文件。我从Google Code下载了所有文件。所有文件都是最新的。 appStore中有一些应用程序从图像中提取泰米尔语文本。我不知道人们是怎么做的。
当我将泰米尔语文本包含的图像传递给Tesseract时,我得到的错误就像没有像tam.cube.lm,tam.cube.size..etc这样的文件。我在互联网上搜索了很多,但我找不到泰米尔语的文件。
请帮帮我,在哪里可以找到这些文件。?
以下给出的代码 - >
import UIKit
protocol ValueFromTesseractProtocol
{
func textRecognizedFromImage(text : String, booleanValue : Bool)
}
class TesseractModel: NSObject
{
var delegate : ValueFromTesseractProtocol!
//MARK: - Creating sharedInstance
class var sharedInstance: TesseractModel {
struct Static {
static var sharedInstance: TesseractModel?
static var token: dispatch_once_t = 0
}
dispatch_once(&Static.token) {
Static.sharedInstance = TesseractModel()
}
return Static.sharedInstance!
}
//MARK: - imageRecognition
func imageRecognition(image : UIImage)
{
let tesseract = G8Tesseract()
tesseract.language = "eng+tam"
tesseract.engineMode = G8OCREngineMode.CubeOnly
tesseract.maximumRecognitionTime = 60.0
tesseract.pageSegmentationMode = G8PageSegmentationMode.Auto
tesseract.image = image.g8_blackAndWhite()
tesseract.recognize()
if let recognizedText = tesseract.recognizedText
{
// Call delegate - Pass value
self.delegate.textRecognizedFromImage(recognizedText, booleanValue: true)
}
else
{
// Call delegate - Nil Value
self.delegate.textRecognizedFromImage("", booleanValue: false)
}
}
}