Tesseract数字识别:什么是最常见的OCR选项

时间:2013-09-11 08:51:00

标签: ios ocr tesseract image-recognition number-recognition

这是我通过Tesseract引擎进行数字识别的iOS OCR代码:

Tesseract* tesseract = [[Tesseract alloc] initWithDataPath:@"tessdata" language:@"eng"];

//set the tesseract variables
[tesseract setVariableValue:@"0123456789" forKey:@"tessedit_char_whitelist"];

NSString * temp = @"7";
[tesseract setVariableValue:temp forKey:@"tessedit_pageseg_mode"];

[tesseract setImage:argImage];
[tesseract recognize];
m_convertedText = [[tesseract recognizedText] copy];

使用上面的内容,我可以正确识别一些图像。但是有时我会得到5而不是8,6而不是5等等。我的输入图像相当完美 - 二值化后的纯黑色和白色。

我还缺少任何其他Tesseract选项吗? 我看到有600多个选项和非常稀疏的文档。

我能找到的最好的是this website,它列出了所有选项,但对于OCR初学者来说还不是很清楚。

如果某人使用tesseract使用数字OCR达到了100%的准确率,那将非常有帮助。

0 个答案:

没有答案