我创建了一个控制台应用程序。 添加了对tessnet2_32的引用。
Ocr ocr = new Ocr();
using (Bitmap bmp = new Bitmap(filename))
{
tessnet2.Tesseract tessocr = new tessnet2.Tesseract();
tessocr.Init(@"C:\temp\tessdata", "eng", false);
...
我也尝试将"C:\temp\tessdata"
更改为
C:\work\ConsoleApplication3\ConsoleApplication3
C:\work\ConsoleApplication3\ConsoleApplication3\tessdata
C:\work\ConsoleApplication3\ConsoleApplication3\bin\debug
C:\work\ConsoleApplication3\ConsoleApplication3\bin
C:\work\ConsoleApplication3\ConsoleApplication3\bin\debug\tessdata
C:\work\ConsoleApplication3\ConsoleApplication3\bin\tessdata
C:\work\ConsoleApplication3\ConsoleApplication3\debug\tessdata
C:\work\ConsoleApplication3\tessdata
C:\work\ConsoleApplication3\
tessdata
文件夹本身包含9个失败,并被添加到所有这些位置:
eng.cube.bigrams
eng.cube.fold
eng.cube.lm
eng.cube.bigrams
eng.cube.params
eng.cube.size
eng.cube.word-freq
eng.tesseract_cube.nn
eng.traineddata
但它始终存在于.Init行,并带有消息:
The file 'z:\dev\interne\cs\tesseract-ocr-svn\dotnet\tessnet2.cpp' does not exist.
我无法想象为什么它只是试图访问某些Z盘而我只有C.或者我只是完全误解了错误。
有人能够友好地逐步讲述要做什么和/或我做错了什么?即使在阅读了30多个谷歌链接后,我也感到完全迷失了。
答案 0 :(得分:1)
您使用的是错误版本的语言数据文件;你拥有的是Tesseract 3.0x。 tessnet2是Tesseract 2.04的.NET包装器,因此您需要加载兼容的数据文件。
尝试从https://sourceforge.net/projects/tesseract-ocr-alt/files/下载tesseract-2.00.eng.tar.gz。