为Tesseract提供模式

时间:2014-11-11 02:07:35

标签: tesseract

我一起使用go和tesseract。我有类似的东西 2 ^ 3或22 ^ 55

Tesseract有时候仍然会出现白名单错误,所以我正在寻找一种方法来提供我通过FaQ阅读的模式,然后在集市上尝试了建议的选项。

My Pattern文件如下所示:



\d\d^\d\d
\d^\d\d
\d^\d
\d^\d\d




但不知怎的,它仍然无法运作。是否有任何提示使其工作或是实现此目的生成新语言文件的唯一方法。

1 个答案:

答案 0 :(得分:1)

不是开发者,请原谅我。

前一段时间我正在研究一个类似的问题,发现源代码中的描述令人困惑,因为默认情况下tesseract需要在模式前面有4个以上的常量字符。它甚至提供了在默认条件下无效的示例。

然而,这是可配置的,如下所述: The trie.h code

kSaneNumConcreteChars我很确定你所追求的参数。

希望这有帮助。