脚本为我进行网络调查

时间:2009-09-01 19:42:57

标签: java robot

今天我不得不接受调查一般调查,格式如下:问了一个问题,然后点击下一个按钮后,答案显示为“答案:_”以及解释。对于踢球,我想做一个程序,可以接受这个调查,回答任何信件,然后转到下一页并阅读答案,然后返回并将答案更改为正确的答案,然后前进2页,重复。

我熟悉Java和Python,但我不确定如何让他们“知道”按钮的位置,以及如何“读取”文本而不需要不必要的图像识别。

这只是一个有趣的项目,没什么大不了的,但我很感激让我开始的任何想法。

3 个答案:

答案 0 :(得分:1)

假设文本就是那样(文本而不是图像),那么有一些有用的工具可供您使用:

  • .Net WebControl - 我之前从.Net编写过此脚本。它的优点是使页面上的所有JS仍然可用。我知道这不是Java,但是对于这种任务而言,这非常容易。
  • Selenium - 它主要是一个Web测试框架,但很容易从Java编写脚本以自动提交表单。
  • TagSoup for Java - 如果页面没有需要运行的重要javascript代码,则有许多Java的HTML解析器可能会用于开发一个刮刀。

答案 1 :(得分:0)

将它发布到调查猴子页面是否不切实际?然后你可以做一些正则表达式来拉出“answer:__”并在原始页面中查找该模式。这肯定比尝试点击浏览器中的东西等更容易。基本上,编写一个java应用程序或python,用于按顺序对调查页面进行http发布,并使用正则表达式查找下一页等,然后使用用于跟踪历史的堆栈。

修改如果不清楚,请告诉我,我会澄清

编辑2:我完全忘了HTMLUnit,我的不好。它是一个像jsight建议的测试框架,但专门用于Java和与JUnit非常相似的功能,但是,因为它是为测试Web应用程序而设计的,它可以用于自动化与其他站点的交互

答案 2 :(得分:-1)

您可以使用简单的图片搜索来完成。首先截图按钮的一个独特部分并保存。这将用作您单击鼠标的位置的相对参考。然后在实际运行应用程序期间,获取整个屏幕的屏幕截图,找到与之前保存的图像匹配的部分,然后让鼠标根据按钮图像位置点击相应的位置。