培训tesseract后,tessdata文件夹中应包含哪些文件?

时间:2012-07-26 16:58:33

标签: c# image-processing ocr tesseract tessnet2

我使用tesseract作为我的ANPR应用程序的OCR引擎。我已经使用车牌字体训练了tesseract 3.01v。但我需要知道:

  1. tessdata文件夹中应包含哪些文件?
  2. 我应该使用安装tesseract 3.01v的相同tessdata文件夹吗?
  3. 我接受过tesseract 3.01v的培训,我在代码中使用了tessnet2,这样会有问题吗?
  4. 以下是我尝试过的代码,但它一直退出DoOcr()方法。

    List<tessnet2.Word> ocrText = new List<tessnet2.Word>();
    tessnet2.Tesseract ocr = new tessnet2.Tesseract();
    ocr.Init(@"C:\Program Files (x86)\Tesseract-OCR\tessdata", "eng", true);
    ocrText = ocr.DoOCR(bmpGrayScale, new Rectangle(rect.X, rect.Y, rect.Width, rect.Height));
    
    foreach (tessnet2.Word word in ocrText)
    Console.WriteLine("{0} : {1}", word.Confidence, word.Text);
    

    有没有人知道什么是错的?

1 个答案:

答案 0 :(得分:1)

“3.01不向后兼容2.04。数据文件不同。”

http://code.google.com/p/tesseract-ocr/wiki/ReadMe

对于与3.01兼容的.NET库,请查看http://code.google.com/p/tesseractdotnet/https://github.com/charlesw/tesseract-ocr-dotnet处的项目。