OCR和单词审查

时间:2010-03-07 11:31:13

标签: ocr tesseract

我正在使用Tesseract作为我的字母识别项目,目前认可度非常好。图像处理部分使用OpenCv库完成。 这些字母是手写的。但是当我用它来识别字母“O”和数字“0”时有一些问题。这些字母在数据区域中用作输入名称的字段。所以名字不能包含任何数字。当我们使用数据字段的系统作为出生日期时,它只包含数字。所以我愿意限制识别系统说相应的数据字段只有数字或字母。

而且我也愿意用可能的单词检查已识别的字母,这样我们就可以提高数据的准确性。我愿意使用openCv库来完成这项任务。但我不知道有哪些库可以帮助完成这项任务,以及这些库的功能是什么。所以请一些人帮助我。谢谢。

此致 提兰卡。

1 个答案:

答案 0 :(得分:3)

我从未使用过Tesseract。但是,in the FAQ it says

我如何仅识别数字?

TessBaseAPI::SetVariable("tessedit_char_whitelist", "0123456789");

据推测,您可以使用FAQ条目的模式进行设置,这样它只能识别字母或数字。

如果您已经尝试过此操作,是否可以提供有关其无效的详细信息?