CAPTCHAS和img名称/显示值关联

时间:2010-12-28 18:57:26

标签: security screen-scraping theory captcha recaptcha

不幸的是,我在用一个短语/一行来总结这个问题时遇到了麻烦,因此我不得不在提出问题之前暗示我的理解是什么,因为害怕我根据错误的事实或假设提出问题。正如我所理解的那样“如果我错了就请纠正我”,因为据我所知,验证码的工作原理如下:

  1. 拥有大量图片,并将每个图片名称/来源与其显示的字符值相关联。
  2. 显示图片,然后让用户输入他们看到的内容。
  3. 将用户的输入与与该图像的名称/来源相关联的字符值进行匹配。
  4. 假设我的理解是正确的:给定无限的时间,

    • 无法关联图片 显示的名称/来源 人物增加的几率 在他们聚集时破解验证码 更多协会?

    • 在这种情况下,验证码的安全强度是否与图像数据库的大小并行?

      通知:

      我怀疑我的问题是基于错误的理解。

1 个答案:

答案 0 :(得分:1)

简短回答!这些是动态图像,不会存储在任何地方。 你甚至不会在源代码中找到它们。

Wikipedia对此有很好的解释。或者,查看SO中的相关问题。

修改:Goto此页面,您可以在其中查看验证码示例。使用firebug查看此图像的HTML代码,您将看到类似的内容。

<img height="57" width="300" src="http://www.google.com/recaptcha/api/image?c=03AHJ_VutaG4ahxWuQv0e6edYypp_FM8QuFIZkG75AnAm8iu3WRmwQ41jqcvojmKmbSKXxkf_s9fk61-axEp77_omKZZEYliE35BND_hXNh3Jac6ZUAeD08wOMZPj4W2s-A39vAI84eim5q-z9kFnmoSmon1jG2LmmFw" style="display: block;">

您是否注意到来源?它不指向图像文件。

您可以复制此网址并生成图片(只需在浏览器中打开)即可。所以你可以开发一个应用程序,它可以下载这个图像,然后扫描像素的颜色变化,并尝试匹配字母和数字,但如果你注意到几乎所有的字母和数字是连接和更接近,所以很难分开不同的字母表。

即使你设法分离大部分字母都不完美。例如:

http://www.watblog.com/wp-content/uploads/2010/09/captcha.png