将经过培训的tesseract文件合并为一个

时间:2013-07-02 08:23:50

标签: java macos ocr

我在Mac上使用最新版本的Tesseract。我在一个文件夹中有一个eng.traineddata,在另一个文件夹中有一个eng.traineddata。我希望将我的训练数据文件合并到一个训练有素的大字体文件中。

谁能告诉我怎么做?我在某处读过-l命令可能就是我需要的。

谢谢!

2 个答案:

答案 0 :(得分:3)

Tesseract不会在两个不同的文件夹中查找语言数据。您可以执行的操作是将其中一个重命名为eng1.traineddata,然后将其指定为-l eng+eng1命令的tesseract选项。

答案 1 :(得分:1)

我也试过了,但似乎只有在我们通过同时编译多个图像来创建训练的数据文件时才有可能。 这是详细的程序......

" https://printalert.wordpress.com/2014/10/28/tesseract-training-more-fonts/"