我想在java的网站上获取图片的网址。 我使用这个函数下载html代码:
public static String getWebPage(URL url) {
try {
StringBuilder sb = new StringBuilder();
InputStreamReader isr = null;
HttpURLConnection httpcon = (HttpURLConnection) url.openConnection();
httpcon.addRequestProperty("User-Agent", "Chrome/61.0");
isr = new InputStreamReader(httpcon.getInputStream());
BufferedReader br = new BufferedReader(isr);
String line = br.readLine();
while (line != null) {
sb.append(line);
sb.append("\n");
line = br.readLine();
}
br.close();
isr.close();
return sb.toString();
} catch (Exception e) {
e.printStackTrace();
return "";
}
}
我需要的图片是在这个网站上:https://proxer.me/read/2717/1/en/1。 这是图像的位置:“// manga1.proxer.me/f/2717/78407/001.jpg”(正文 - >包装 - >主 - >读者)。我需要一个程序,可以使用html代码找到图像的URL。
我使用上面的函数下载了html源代码。通常我会尝试使用java String.substring()和String.indexOf()来查找图像URL。但是在下载代码时,它不包含有关图像的信息。
这是下载的html代码:https://pastebin.com/US9Vf13D
我认为有些javascript正在改变代码,但我不知道哪个javascript。我也尝试使用chrome dev工具(DOM断点)找到它,但由于某种原因我没有工作。谁能帮我这个?