使用java从文本文件将信息输入到网页

时间:2012-06-30 08:45:20

标签: java html parsing

我正在构建一个程序,从一个网页获取信息并将其输入另一个网页,解析原始页面的信息不是问题,但我不知道如何从文本文件中获取信息并进入使用脚本的不同网站的文本字段。谷歌没有帮助,这可以用java来完成吗?

2 个答案:

答案 0 :(得分:2)

您可以采取以下两种方式来执行此操作:

1)使用像HttpClient这样的库,并将您直接收集的信息发布到网站上。

2)使用像Selenium这样的Web测试框架与浏览器进行交互并填写表单。

选项1是迄今为止最强大和最快的选项,但是(2)让您使用目标可能依赖的任何客户端代码(javascript)。

答案 1 :(得分:1)

如果问题是如何以编程方式在Java中提交表单,我建议您查看Apache HTTP Components Client,这是一个为您完成所有艰苦工作的类库。

文档非常好,所以我建议你先阅读至少their tutorial,但这是我从他们的网站上借来的一个小代码片段,展示了如何用变量user和password发布表单

PostMethod post = new PostMethod("http://jakarata.apache.org/");
NameValuePair[] data = {
  new NameValuePair("user", "joe"),
  new NameValuePair("password", "bloggs")
};
post.setRequestBody(data);
// execute method and handle any error responses.
...
InputStream in = post.getResponseBodyAsStream();
// handle response.

现在,我同意Marijn和Jared的观点,如果这只是一次拍摄,那可能就不值得了,而且使用例如cURL或Selenium的一些创意脚本可以更快地解决你的问题。