如何在tesseract中使用所有可用的语言?

时间:2016-08-19 14:14:11

标签: c# ocr tesseract

我想创建一个简单的WPF程序,用于使用tesseract进行OCR扫描,用户可以选择要扫描的语言。现在由于某种原因,tesseract希望有一个带有语言文件的tessdata文件夹直接在其中而不是语言子文件夹。

using (var engine = new TesseractEngine(@"./tessdata", "deu", EngineMode.Default))
如果deu文件不直接位于tessdata文件夹中,则

不起作用 - 使用@"./tessdata/deu"时它也不起作用。

仅当语言文件直接位于tessdata文件夹中时(也在项目结构中),它才有效。

如何正确使用所有可用语言?

²实际上,如果可能的话,以后我想自动检测图像中的语言 - 例如通过使用每种语言扫描每个图像并检查哪种语言具有最佳结果。如果您对如何做到这一点有任何想法,请告诉我。

1 个答案:

答案 0 :(得分:2)

您应该在项目的 debug 文件夹中创建一个 tessdata 目录,并将语言文件放在此处。