我正在尝试制作一个Japanese
OCR
应用。我尝试初始化Tesseract
时遇到此错误。下面是我的代码:
if let tesseract = G8Tesseract(language: "eng+jpn") {
tesseract.engineMode = .tesseractCubeCombined
tesseract.pageSegmentationMode = .auto
tesseract.image = image.g8_blackAndWhite()
tesseract.recognize()
textView.text = tesseract.recognizedText
}
最后,我发现我没有多维数据集文件,也无法在github和其他站点上搜索它们。谁能给我任何链接,我可以在其中找到其他语言的多维数据集文件?
答案 0 :(得分:0)
并非所有语言都提供多维数据集文件。如我所用
tesseract.engineMode = .tesseractCubeCombined
上面的代码,它将尝试同时使用多维数据集文件和常规.traineddata
文件。为了解决这个问题,我必须替换下面的上述代码,并在名为langdata
的文件夹下仅为特定语言添加.traineddata
为tessdata
的格式。
tesseract.engineMode = .tesseractOnly