互联网机器人 - 填写表格

时间:2011-09-22 23:08:02

标签: javascript html bots

互联网机器人如何在网站上随机填写表格?我猜他们下载HTML源代码并找出表单的存在。但那么他们究竟是如何填写并实际提交信息的呢?

我知道许多表格使用Captcha,但是许多系统也使用检测鼠标移动,键盘事件等技术来区分人类与机器人。机器人也可以击败它们。

基本上,我想知道机器人是否有任何方式可以跟踪代码中的Javascript变化,即对页面的动态更改?

P.S:我正在将这些信息用于关于击败机器人技术的毕业设计项目。

3 个答案:

答案 0 :(得分:1)

您并不需要始终下载源代码。你可以手动找到表单字段,然后构建提交的东西(几乎任何东西,例如Python脚本)。

<form action="submit.php" method="post">
<input name="url" />
<input name="name" />
<input type="submit" />
</form>

然后使用任何语言向site.com/submit.php发送POST请求。通常使用数据“url = xxx&amp; name = xxx”。

基于标签虽然不太可能,但您可以使用JS或HTML。

答案 1 :(得分:1)

查看脚本语言的有状态浏览器。 Python有一个名为mechanize

的模块

答案 2 :(得分:1)

某些测试平台(如Watir)实际上执行的是鼠标和键盘操作,而不仅仅是HTTP请求(因此可以避免使用Javascript中的任何机器人预防方法)。这意味着基本上不可能区分机器人和人类。像Captcha这样的东西依赖于机器人无法正确识别图像中的一个或多个单词,但即便如此,也可以通过OCR来解决这个问题。

基本上你可以采取许多措施来阻止机器人,但如果他们勤奋的话,几乎不可能阻止它们。