iOS-Tesseract-无法读取多维数据集语言模型多维数据集错误(CubeRecoContext :: Create):无法初始化CubeRecoContext对象

时间:2018-08-13 04:46:35

标签: ios tesseract

我正在尝试制作一个Japanese OCR应用。我尝试初始化Tesseract时遇到此错误。下面是我的代码:

if let tesseract = G8Tesseract(language: "eng+jpn") {
    tesseract.engineMode = .tesseractCubeCombined
    tesseract.pageSegmentationMode = .auto
    tesseract.image = image.g8_blackAndWhite()
    tesseract.recognize()
    textView.text = tesseract.recognizedText
}

最后,我发现我没有多维数据集文件,也无法在github和其他站点上搜索它们。谁能给我任何链接,我可以在其中找到其他语言的多维数据集文件?

1 个答案:

答案 0 :(得分:0)

并非所有语言都提供多维数据集文件。如我所用

tesseract.engineMode = .tesseractCubeCombined 

上面的代码,它将尝试同时使用多维数据集文件和常规.traineddata文件。为了解决这个问题,我必须替换下面的上述代码,并在名为langdata的文件夹下仅为特定语言添加.traineddatatessdata的格式。

tesseract.engineMode = .tesseractOnly