找不到让tessnet2工作的方法

时间:2013-02-25 13:04:18

标签: c# tesseract object-recognition tessnet2

我创建了一个控制台应用程序。 添加了对tessnet2_32的引用。

Ocr ocr = new Ocr();
using (Bitmap bmp = new Bitmap(filename))
{
    tessnet2.Tesseract tessocr = new tessnet2.Tesseract();
    tessocr.Init(@"C:\temp\tessdata", "eng", false);
...

我也尝试将"C:\temp\tessdata"更改为

C:\work\ConsoleApplication3\ConsoleApplication3
C:\work\ConsoleApplication3\ConsoleApplication3\tessdata
C:\work\ConsoleApplication3\ConsoleApplication3\bin\debug
C:\work\ConsoleApplication3\ConsoleApplication3\bin
C:\work\ConsoleApplication3\ConsoleApplication3\bin\debug\tessdata
C:\work\ConsoleApplication3\ConsoleApplication3\bin\tessdata
C:\work\ConsoleApplication3\ConsoleApplication3\debug\tessdata
C:\work\ConsoleApplication3\tessdata
C:\work\ConsoleApplication3\

tessdata文件夹本身包含9个失败,并被添加到所有这些位置:

eng.cube.bigrams
eng.cube.fold
eng.cube.lm
eng.cube.bigrams
eng.cube.params
eng.cube.size
eng.cube.word-freq
eng.tesseract_cube.nn
eng.traineddata

但它始终存在于.Init行,并带有消息:

The file 'z:\dev\interne\cs\tesseract-ocr-svn\dotnet\tessnet2.cpp' does not exist.

我无法想象为什么它只是试图访问某些Z盘而我只有C.或者我只是完全误解了错误。

有人能够友好地逐步讲述要做什么和/或我做错了什么?即使在阅读了30多个谷歌链接后,我也感到完全迷失了。

1 个答案:

答案 0 :(得分:1)

您使用的是错误版本的语言数据文件;你拥有的是Tesseract 3.0x。 tessnet2是Tesseract 2.04的.NET包装器,因此您需要加载兼容的数据文件。

尝试从https://sourceforge.net/projects/tesseract-ocr-alt/files/下载tesseract-2.00.eng.tar.gz。