这是我通过Tesseract引擎进行数字识别的iOS OCR代码:
Tesseract* tesseract = [[Tesseract alloc] initWithDataPath:@"tessdata" language:@"eng"];
//set the tesseract variables
[tesseract setVariableValue:@"0123456789" forKey:@"tessedit_char_whitelist"];
NSString * temp = @"7";
[tesseract setVariableValue:temp forKey:@"tessedit_pageseg_mode"];
[tesseract setImage:argImage];
[tesseract recognize];
m_convertedText = [[tesseract recognizedText] copy];
使用上面的内容,我可以正确识别一些图像。但是有时我会得到5而不是8,6而不是5等等。我的输入图像相当完美 - 二值化后的纯黑色和白色。
我还缺少任何其他Tesseract选项吗? 我看到有600多个选项和非常稀疏的文档。
我能找到的最好的是this website,它列出了所有选项,但对于OCR初学者来说还不是很清楚。
如果某人使用tesseract使用数字OCR达到了100%的准确率,那将非常有帮助。