Tesseract如何创建所有文件

时间:2013-11-04 18:40:25

标签: c# ocr tesseract

我正在测试Emgu.CV中的LicensePlateDetector,它与英文车牌完美配合。

然后我从tesserac-ocr PT文件下载(因为我想使用葡萄牙语牌照),但是当我解压缩文件时我只有一个简单的文件:“por.traineddata”。如果我将此文件传递给我的namespace / tessdata,则LicensePlateDetector不起作用。

我下载文件: enter image description here enter image description here

如何创建“DangAmbigs”,“freq-dawg”,“inttemp”,“normproto”,“pffmtable”,“unicharset”,“user-words”和“word-dawg”文件?

感谢

enter image description here

实例

/// <summary>
  /// Create a license plate detector
  /// </summary>
  public LicensePlateDetector()
  {
     //create OCR engine
     _ocr = new Tesseract();

     //You can download more language definition data from
     //http://code.google.com/p/tesseract-ocr/downloads/list
     //Languages supported includes:
     //Dutch, Spanish, German, Italian, French and English
     _ocr.Init(null, "eng", false);
  }

1 个答案:

答案 0 :(得分:0)

这些英文数据文件是Tesseract 2.0x版本。因此,请尝试下载相同版本的葡萄牙语数据。

http://code.google.com/p/tesseract-ocr/downloads/detail?name=tesseract-2.01.por.tar.gz&can=2&q=