应用错误收集

培训tesseract和多页tiff

时间：2012-05-27 00:11:17

标签： ocr tesseract

我在Windows 7 64位上使用tesseract 3.0.1。

有关培训的文件说：

每个字体应该放在一个多页tiff中（只有你自己使用libtiff！）

我对libtiff不熟悉。我使用ImageMagick创建多页tiff。到目前为止，这种方法运作良好，或者至少看起来很好。我希望以后能够获得一些路障吗？如果是这样，如何处理libtiff - 是否足以运行其设置或我需要配置什么？

1 个答案:

答案 0 :(得分：1)

Tesseract并不关心你如何制作你的多页tiff，只要它能用leptonica读取它（内部依赖于libtiff）。如果tesseract现在可以处理你的tiff，它可以在剩余的训练过程中运行并运行OCR，所以你很高兴。我用.Net标准库生成了我的多页tiff，tesseract没有问题。