我正在开发一个OCR项目,我必须将图像转换为文本。如果我只使用英语,那么我可以使Tesseract工作,但是因为我必须转换俄语文本,它变得更加麻烦。我使用tesseractdotnet v301_r590(据我所知最新)来自以下网站,该网站完全使用语言数据3.01:
https://code.google.com/p/tesseractdotnet/downloads/list
但是,在查看俄语语言数据时,我只能看到版本3.02(与当前版本的tesseractdotnet v301_r590不兼容)。我试图下载原始tesseract(C ++代码)的源代码,并尝试从中创建一个DLL;但是我甚至无法启动它(也许是因为我使用VS 2012?我有创建者要求的Visual C ++ 2008)。
我的问题是 - 如何升级tesseractdotnet以使其能够使用3.02语言数据?