应用错误收集

脚本为我进行网络调查

时间：2009-09-01 19:42:57

标签： java robot

今天我不得不接受调查一般调查，格式如下：问了一个问题，然后点击下一个按钮后，答案显示为“答案：_”以及解释。对于踢球，我想做一个程序，可以接受这个调查，回答任何信件，然后转到下一页并阅读答案，然后返回并将答案更改为正确的答案，然后前进2页，重复。

我熟悉Java和Python，但我不确定如何让他们“知道”按钮的位置，以及如何“读取”文本而不需要不必要的图像识别。

这只是一个有趣的项目，没什么大不了的，但我很感激让我开始的任何想法。

3 个答案:

答案 0 :(得分：1)

假设文本就是那样（文本而不是图像），那么有一些有用的工具可供您使用：

.Net WebControl - 我之前从.Net编写过此脚本。它的优点是使页面上的所有JS仍然可用。我知道这不是Java，但是对于这种任务而言，这非常容易。
Selenium - 它主要是一个Web测试框架，但很容易从Java编写脚本以自动提交表单。
TagSoup for Java - 如果页面没有需要运行的重要javascript代码，则有许多Java的HTML解析器可能会用于开发一个刮刀。

答案 1 :(得分：0)

将它发布到调查猴子页面是否不切实际？然后你可以做一些正则表达式来拉出“answer：__”并在原始页面中查找该模式。这肯定比尝试点击浏览器中的东西等更容易。基本上，编写一个java应用程序或python，用于按顺序对调查页面进行http发布，并使用正则表达式查找下一页等，然后使用用于跟踪历史的堆栈。

修改如果不清楚，请告诉我，我会澄清

编辑2：我完全忘了HTMLUnit，我的不好。它是一个像jsight建议的测试框架，但专门用于Java和与JUnit非常相似的功能，但是，因为它是为测试Web应用程序而设计的，它可以用于自动化与其他站点的交互

答案 2 :(得分：-1)

您可以使用简单的图片搜索来完成。首先截图按钮的一个独特部分并保存。这将用作您单击鼠标的位置的相对参考。然后在实际运行应用程序期间，获取整个屏幕的屏幕截图，找到与之前保存的图像匹配的部分，然后让鼠标根据按钮图像位置点击相应的位置。