将Tesseract DotNet升级到最新版本

时间:2014-06-30 07:28:08

标签: c# ocr tesseract

我正在开发一个OCR项目,我必须将图像转换为文本。如果我只使用英语,那么我可以使Tesseract工作,但是因为我必须转换俄语文本,它变得更加麻烦。我使用tesseractdotnet v301_r590(据我所知最新)来自以下网站,该网站完全使用语言数据3.01:

https://code.google.com/p/tesseractdotnet/downloads/list

但是,在查看俄语语言数据时,我只能看到版本3.02(与当前版本的tesseractdotnet v301_r590不兼容)。我试图下载原始tesseract(C ++代码)的源代码,并尝试从中创建一个DLL;但是我甚至无法启动它(也许是因为我使用VS 2012?我有创建者要求的Visual C ++ 2008)。

我的问题是 - 如何升级tesseractdotnet以使其能够使用3.02语言数据?

1 个答案:

答案 0 :(得分:1)

使用Charles Weld的.Net wrapper for tesseract-ocr - 它与版本3.02兼容。