我如何设计类似于reCAPTCHA的系统?

时间:2009-06-02 21:00:01

标签: captcha recaptcha

我对SO上使用的CAPTCHA系统很着迷...我想了解更多关于使{cocTCHA'工作的“many factors”。可以理解的是,开发人员可能会被滥用,他们对系统的确切内部工作方式保持相当安静......但这种行为有充分的记录,所以也许我的好奇心仍然可以满足:

如果我要设计一个reCAPTCHA的克隆,我该怎么办呢?


reCAPTCHA允许:

  1. 打字错误
  2. 在人们做的地方。 这表明我需要获取有关错误的历史数据,然后根据该数据制作算法。
  3. 检测打字错误需要大量使用数据库:一个用于书籍数字化的文字,另一个用于已知的文字。

    技术已知细节

    1. 两个数据库:一个用于已知单词,另一个用于未知单词
    2. 后续数据库,用于组合单词
    3. 未知技术细节

      1. 如何在飞行中分离单词,以便您看到来自不同数据库的单词组合? 这是关于信号处理的。
      2. 如何为用户提供来自两个数据库的数据?
      3. 哪个是两个独立数据库中的初始数据形式? PDF?
      4. 当两个数据库的数据合并时,后续的数据形式是什么? PDF?
      5. 如何将数据从两个pdf文件组合成一个?
      6. 如何有效地旋转图像?
      7. 使用哪些算法将图像与图书分开?
      8. 相关主题

        1. 信号处理
        2. 微积分:用于单词检测算法的傅里叶和拉普拉斯等系列。
        3. 概率论:拥有一个“计算机 - 人类”系数,只有当它具有95置信区间时才会通过
        4. 也许数论:我们需要有效地存储和比较数据

1 个答案:

答案 0 :(得分:3)