请参阅图片:http://s18.postimg.org/wvwj4yt4l/ashx.jpg
我认为我的图像非常简单但是tesseract-ocr无法识别它:(它显示“A§§§SX”,而不是A9FCCC
请告诉我原因? tesseract如何认识它?
由于
答案 0 :(得分:0)
基本的Tesseract Engine 不适用于CPATCHA破解。即使文本/字母角度不是完全水平的,打印介质的扫描页面也会很好。 失真和像素化 - 在一定程度上 - 也不会有太大问题。
但带的字母(大幅)格式错误的形状就像您关联的那样,将无法识别。 OCR,特别是CAPTCHA破解比下载Tesseract二进制文件要复杂得多。如果这很容易,那么所有付费服务都将在夜间停业。 OCR主题非常复杂,我个人不敢触摸它。