Java从html网站

时间:2017-10-06 15:09:11

标签: javascript java html

我想在java的网站上获取图片的网址。 我使用这个函数下载html代码:

   public static String getWebPage(URL url) {
    try {
        StringBuilder sb = new StringBuilder();
        InputStreamReader isr = null;
        HttpURLConnection httpcon = (HttpURLConnection) url.openConnection();
        httpcon.addRequestProperty("User-Agent", "Chrome/61.0");
        isr = new InputStreamReader(httpcon.getInputStream());
        BufferedReader br = new BufferedReader(isr);
        String line = br.readLine();
        while (line != null) {
            sb.append(line);
            sb.append("\n");
            line = br.readLine();
        }
        br.close();
        isr.close();

        return sb.toString();
    } catch (Exception e) {
        e.printStackTrace();
        return "";
    }
}

我需要的图片是在这个网站上:https://proxer.me/read/2717/1/en/1。 这是图像的位置:“// manga1.proxer.me/f/2717/78407/001.jpg”(正文 - >包装 - >主 - >读者)。我需要一个程序,可以使用html代码找到图像的URL。

我使用上面的函数下载了html源代码。通常我会尝试使用java String.substring()和String.indexOf()来查找图像URL。但是在下载代码时,它不包含有关图像的信息。

这是下载的html代码:https://pastebin.com/US9Vf13D

我认为有些javascript正在改变代码,但我不知道哪个javascript。我也尝试使用chrome dev工具(DOM断点)找到它,但由于某种原因我没有工作。谁能帮我这个?

0 个答案:

没有答案