Question

这是我通过Tesseract引擎进行数字识别的iOS OCR代码：

Tesseract* tesseract = [[Tesseract alloc] initWithDataPath:@"tessdata" language:@"eng"];

//set the tesseract variables
[tesseract setVariableValue:@"0123456789" forKey:@"tessedit_char_whitelist"];

NSString * temp = @"7";
[tesseract setVariableValue:temp forKey:@"tessedit_pageseg_mode"];

[tesseract setImage:argImage];
[tesseract recognize];
m_convertedText = [[tesseract recognizedText] copy];

使用上面的内容，我可以正确识别一些图像。但是有时我会得到5而不是8,6而不是5等等。我的输入图像相当完美 - 二值化后的纯黑色和白色。

我还缺少任何其他Tesseract选项吗？我看到有600多个选项和非常稀疏的文档。

我能找到的最好的是this website，它列出了所有选项，但对于OCR初学者来说还不是很清楚。

如果某人使用tesseract使用数字OCR达到了100％的准确率，那将非常有帮助。

Tesseract数字识别：什么是最常见的OCR选项

0 个答案: