我想创建一个简单的WPF程序,用于使用tesseract进行OCR扫描,用户可以选择要扫描的语言。现在由于某种原因,tesseract希望有一个带有语言文件的tessdata文件夹直接在其中而不是语言子文件夹。
using (var engine = new TesseractEngine(@"./tessdata", "deu", EngineMode.Default))
如果deu文件不直接位于tessdata文件夹中,则不起作用 - 使用@"./tessdata/deu"
时它也不起作用。
仅当语言文件直接位于tessdata文件夹中时(也在项目结构中),它才有效。
如何正确使用所有可用语言?
²实际上,如果可能的话,以后我想自动检测图像中的语言 - 例如通过使用每种语言扫描每个图像并检查哪种语言具有最佳结果。如果您对如何做到这一点有任何想法,请告诉我。
答案 0 :(得分:2)
您应该在项目的 debug 文件夹中创建一个 tessdata 目录,并将语言文件放在此处。