合并训练有素的数据文件 - Tesseract

时间:2013-09-21 10:40:29

标签: file merge ocr tesseract

我在tesseract中使用了两个训练有素的数据文件来识别两种语言。但由于准确性不够好,我训练了tesseract并生成了一个新的训练数据文件,我想将它与我使用的两种语言文件中的一种合并。所以我的问题是:如何将新的训练数据文件与以下文件中的一个文件合并:https://code.google.com/p/tesseract-ocr/downloads/list。是否有帮助?

1 个答案:

答案 0 :(得分:0)

您可以unpack现有.traineddata并分别合并组件;但是,我不确定它会起作用。您可以创建ell1.traineddata并在命令行中将其与现有的一起指定,例如:

tesseract image output -l ell+ell1