java - 在Tika 1.13中使用TesseractOCR时如何将解析语言设置为中文？ - Thinbug

在Tika 1.13中使用TesseractOCR时如何将解析语言设置为中文？

时间：2016-11-03 08:13:21

标签： java tesseract apache-tika

TesseractOCRConfig config = new TesseractOCRConfig();
config.setLanguage("chi_sim");

线程中的异常＆＃34; main＆＃34; java.lang.IllegalArgumentException：无效语言代码

当我将语言设置为eng或jpn时，OCR过程可以正常工作，但我必须解析一些包含中文的图片。 chi_sim或chi_tra给了我＆＃34; 语言代码无效＆＃34;异常且chi无效。有人可以帮忙解决它吗？

0 个答案:

没有答案