我在Windows 7 64位上使用tesseract 3.0.1。
有关培训的文件说:
每个字体应该放在一个多页tiff中(只有你自己 使用libtiff!)
我对libtiff不熟悉。我使用ImageMagick创建多页tiff。到目前为止,这种方法运作良好,或者至少看起来很好。我希望以后能够获得一些路障吗?如果是这样,如何处理libtiff - 是否足以运行其设置或我需要配置什么?
答案 0 :(得分:1)
Tesseract并不关心你如何制作你的多页tiff,只要它能用leptonica读取它(内部依赖于libtiff)。如果tesseract现在可以处理你的tiff,它可以在剩余的训练过程中运行并运行OCR,所以你很高兴。 我用.Net标准库生成了我的多页tiff,tesseract没有问题。