reCAPTCHA的数据用于改进任何OCR软件吗?

时间:2011-04-02 21:09:45

标签: ocr recaptcha

reCAPTCHA用于很多地方,毫无疑问有大量的“坏看图像”到“单词”的数据。这种数据可用于制作非常好的OCR软件。那么有没有使用这些数据的OCR软件?

2 个答案:

答案 0 :(得分:1)

可能作为训练数据,我怀疑是否有办法找到答案。但基本上,您可以将其用作OCR软件(您的输入 - 如果已确认 - 用于解码扫描书籍中无法识别OCR的单词)。

答案 1 :(得分:1)

怀疑它。我会回答说,如果谷歌发布与recaptcha相关的数据,它可能会反对他们。但实际上,任何人都可以训练它自己的神经网络去做谷歌所做的事情;问题是,由recaptcha服务的许多图像质量如此糟糕,从这些图像中得出任何结论(或训练naural网络)会产生非常高的假阳性结果