如何检查HTTP响应中的HTML?

时间:2012-07-11 10:11:59

标签: java httpresponse httpurlconnection

如何有效地检查HTTP响应是否包含HTML中的HTML?我正在建立一个HTTP连接,如下所示:

URL url =  new URL(inputURL);
con = (HttpsURLConnection)url.openConnection(proxy);
con.setRequestMethod(request.getMethod());
con.connect();
con.getResponseCode();

有没有办法有效地检查响应是否包含HTML(而不是其他资源,如图像,.css或.js文件)。

3 个答案:

答案 0 :(得分:3)

您有专门的方法:getContentType

在HttpsURLConnection上,它返回接收文件的mime类型。

对于HTML文件,它将是“text / html”。

所以你可以检查:

boolean isHTML = "text/html".equalsIgnoreCase(con.getContentType());

答案 1 :(得分:3)

如果您信任Web服务器返回正确的内容类型标题,您可以检查它们 - 对于HTML应该是:

Content-type:text/html

答案 2 :(得分:2)

您可以从回复中查看内容类型。

    System.out.println(con.getContentType().equals("text/html"));