将自定义短语添加到Tesseract白名单

时间:2013-01-10 06:20:48

标签: android ocr tesseract

我正在Android上构建一个简单的Tesseract应用程序,它的目标是识别简单的命令,如CALL,MESSAGE等。 由于命令数量很少且固定,我想将它们添加到白名单中,这样程序就可以达到更高的精度。我怎样才能做到这一点?非常感谢提前:))

1 个答案:

答案 0 :(得分:5)

据我所知,你不能在tesseract中将单词列入白名单。您只能使用以下代码段

将字符和数字列入白名单

tessBaseAPI.setVariable(TessBaseAPI.VAR_CHAR_WHITELIST “ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmopqrstuvwxyz0123456789%,”);

在使用tessBaseAPI.init(...,...);

初始化tesseract之后