我对tessnet2很新。所以我使用的是Tessnet2,因为我在C#语言中使用OCR。所以我将tessnet_32.dll添加到引用以使OCR工作。但是,我遇到了一个问题。
由于tessnet2是tesseract2.0,我不能使用tesseract github中的所有语言文件。 因此我的问题是:
1)我是否有可能提取lang.traineddata并获取可在tessnet2中使用的所有8个文件? 2)如果没有,有人可以解释我如何训练数据添加新语言? (如韩语或日语)?我知道https://github.com/tesseract-ocr/tesseract/wiki/TrainingTesseract2已经完成了所有步骤。但是当我使用命令行时,我什么也得不到。换句话说,我被困在一个盒子里。如果有人能解释我如何训练安装tesseract 2.0的数据,那就太好了。
感谢您帮助我。