Tesseract OCR用户模式

时间:2016-01-01 22:31:13

标签: ocr tesseract

有没有办法让Tesseract只匹配用户指定的单词或模式? manual声称它是可能的,但我无法在互联网上找到一个记录在案的实例。

以下是许多人寻求帮助的例子,因为它不起作用,而且没有一个人有经过证明的解决方案。

stackoverflow.com/questions/33429143/tesseract-user-pattern-is-not-applied

stackoverflow.com/questions/31874393/tesseract-ocr-force-pattern

stackoverflow.com/questions/26856349/provide-pattern-for-tesseract

stackoverflow.com/questions/22432194/tesseract-ocr-only-detect-user-words

stackoverflow.com/questions/17209919/tesseract-user-patterns

groups.google.com/forum/#!topic/tesseract-ocr/S9CIK3jOMWw

groups.google.com/forum/#!topic/tesseract-ocr/5vFqVcJmHnM

那么我们可以得出结论,这个功能根本不起作用吗?是否有这方面的官方声明?

2 个答案:

答案 0 :(得分:1)

UFT使用Abbyy或Tesseract OCR引擎中的任何一个,并向用户公开方法,允许它们仅匹配用户指定的单词。

您可以详细了解here

答案 1 :(得分:1)

Tesseract Wiki上有一个示例,https://github.com/tesseract-ocr/tesseract/wiki/APIExample-user_patterns

该测试示例在Tesseract 4.x的oem = 1 / LSTM模式下对我有用。

但是,我无法将其用于其他示例或任何其他模式。

我没有看到任何官方声明,在撰写本文时,确实确实该功能不起作用。