无法为tesseract创建traindata(mac os x)

时间:2013-03-01 10:50:21

标签: tesseract leptonica

我正在尝试为tesseract创建特定字体的列车数据,并在以下命令中失败:

tesseract eng.uknumberplate.exp0.tiff foo bach.nochop makebox

我在终端中得到以下输出。

read_params_file: Can't open bach.nochop
Tesseract Open Source OCR Engine v3.02.02 with Leptonica
Error in findTiffCompression: function not present
Error in pixReadStreamTiff: function not present
Error in pixReadStream: tiff: no pix returned
Error in pixRead: pix not read
Unsupported image type.

我已经通过MacPort安装了tesseract和leptonica。

以下是终端中tesseract -v命令的输出。

tesseract 3.02.02
 leptonica-1.68
  zlib 1.2.5

2 个答案:

答案 0 :(得分:0)

batch.nochop,而不是bach.nochop

答案 1 :(得分:0)

您必须转换TIFF的colorspace。使用ImageMagick将您的pdf文件转换为TIFF图像:

$convert -density 300 -depth 8 or 4 file.pdf output.tif 
$convert output.tif -colorspace rgb -type truecolor output.tif

然后尝试运行makebox cmd。