在Tika 1.13中使用TesseractOCR时如何将解析语言设置为中文?

时间:2016-11-03 08:13:21

标签: java tesseract apache-tika

TesseractOCRConfig config = new TesseractOCRConfig();
config.setLanguage("chi_sim");
  

线程中的异常" main" java.lang.IllegalArgumentException:无效   语言代码

当我将语言设置为engjpn时,OCR过程可以正常工作,但我必须解析一些包含中文的图片。 chi_simchi_tra给了我" 语言代码无效"异常且chi无效。有人可以帮忙解决它吗?

0 个答案:

没有答案