我对此article的解读表明,ReCAPTCHA的一个好处是它可以让人类验证书籍的OCR /数字化中无法识别的单词。它通过在“你是人吗?”中使用这些词来做到这一点。试验。所以ReCAPTCHA一石二鸟。太好了!
但我不明白。如果数字化过程无法识别这个词,那么被假定的人输入的输入是什么?这是如何工作的?
答案 0 :(得分:24)
它显示了两个字。其中一台计算机已经知道,另一台则没有。它假设如果你知道另一个正确,你必须知道另一个。
你不知道两者中哪一个已经知道所以你理论上不能欺骗它。此外,它还会向多个人重播一个单词以获得独立确认,然后再将其作为有效答案发送回来源(报纸公司,图书扫描组)。
但是,如果一台电脑无法读取这样的话 CAPTCHA,系统如何知道 正确回答拼图?这里的 方法:每个新单词都无法读取 通过OCR正确地给予用户 与另一个词联系起来 答案已经知道了。该 然后要求用户阅读这两个单词。 如果他们解决了那个问题 答案已知,系统假设 他们的回答对新人来说是正确的 一。然后系统给出新的 图像给了其他一些人 以更高的信心确定 原来的答案是否是 正确的。
答案 1 :(得分:2)
但如果计算机无法读取这样的验证码,系统如何知道拼图的正确答案?方法如下:OCR无法正确读取的每个新单词都会与另一个已知答案的单词一起提供给用户。然后要求用户阅读这两个单词。如果他们解决了已知答案的系统,系统会认为他们的答案对新答案是正确的。系统然后将新图像提供给其他人,以更高的置信度确定原始答案是否正确。