我对SO上使用的CAPTCHA系统很着迷...我想了解更多关于使{cocTCHA'工作的“many factors”。可以理解的是,开发人员可能会被滥用,他们对系统的确切内部工作方式保持相当安静......但这种行为有充分的记录,所以也许我的好奇心仍然可以满足:
如果我要设计一个reCAPTCHA的克隆,我该怎么办呢?
reCAPTCHA允许:
- 打字错误
- 在人们做的地方。 这表明我需要获取有关错误的历史数据,然后根据该数据制作算法。
醇>
检测打字错误需要大量使用数据库:一个用于书籍数字化的文字,另一个用于已知的文字。
技术已知细节
- 两个数据库:一个用于已知单词,另一个用于未知单词
- 后续数据库,用于组合单词
醇>
未知技术细节
- 如何在飞行中分离单词,以便您看到来自不同数据库的单词组合? 这是关于信号处理的。
- 如何为用户提供来自两个数据库的数据?
- 哪个是两个独立数据库中的初始数据形式? PDF?
- 当两个数据库的数据合并时,后续的数据形式是什么? PDF?
- 如何将数据从两个pdf文件组合成一个?
- 如何有效地旋转图像?
- 使用哪些算法将图像与图书分开?
醇>
相关主题
- 信号处理
- 微积分:用于单词检测算法的傅里叶和拉普拉斯等系列。
- 概率论:拥有一个“计算机 - 人类”系数,只有当它具有95置信区间时才会通过
- 也许数论:我们需要有效地存储和比较数据
醇>