无法在Tesseract中制作boxfile(或打开tiff)

时间:2013-03-28 15:12:16

标签: ocr tesseract leptonica

我正在关注these instructions来训练Tesseract OCR引擎获取新字体。

但是,在尝试制作盒子文件时,我收到错误。这是我使用的命令:

H:\Documents\TesseractTraining>tesseract eng.helvetica.exp0.tif eng.helvetica.exp0   batch.nochop makebox

以下是错误消息:

Tesseract Open Source OCR Engine v3.02 with Leptonica
TIFFstream: Sorry, can not handle image.
Unsupported image type.

一些谷歌搜索表明Leptonica安装可能存在错误。我甚至都不知道Leptonica是否已经安装在我的计算机上,并且网页上有几个README(一个名为“README”和一个名为“Documentation”的网页很混乱),这些都不够简单,我不懂我会让它在Windows上运行。我有Visual Studio 2008的Express Edition,所以我不能使用建议的命令提示符。

所以,我的问题是:有人知道可能出错的地方以及我如何解决它?

1 个答案:

答案 0 :(得分:3)

看起来你的形象很糟糕。您可以使用jTessBoxEditor工具创建适合培训目的的TIFF图像。