如何使用Java从网站检索URL?

时间:2008-12-11 14:02:11

标签: java http url connection

我想使用HTTP GET和POST命令从网站检索URL并解析HTML。我该怎么做?

5 个答案:

答案 0 :(得分:20)

您可以将HttpURLConnectionURL结合使用。

URL url = new URL("http://example.com");
HttpURLConnection connection = (HttpURLConnection)url.openConnection();
connection.setRequestMethod("GET");
connection.connect();

InputStream stream = connection.getInputStream();
// read the contents using an InputStreamReader

答案 1 :(得分:4)

这个滴答/批准的答案来自robhruska - 谢谢。这显示了最基本的方法,它很简单,了解了进行简单URL连接所需的内容。但是,长期策略是使用HTTP Client 更高级和功能丰富的方式来完成此任务。

谢谢大家,以下是快速回答:

URL url = new URL("http://example.com");
HttpURLConnection connection = (HttpURLConnection)url.openConnection();
connection.setRequestMethod("GET");
connection.connect();

InputStream stream = connection.getInputStream();
// read the contents using an InputStreamReader

答案 2 :(得分:3)

执行GET最简单的方法是使用内置的java.net.URL。但是,如上所述,httpclient是正确的方法,因为它将允许您和其他人处理重定向。

要解析html,您可以使用html parser

答案 3 :(得分:0)

答案 4 :(得分:0)

我在项目中使用了JTidy,效果很好。 其他解析器的列表是here,但除了JTidy,我不知道它们中的任何一个。