我想做一个简单的REST解析器。
我在从https://www.tumblr.com接收信息时遇到问题。我想获取具有用户帖子完整历史记录的XML文件,可以通过https://[user-name].tumblr.com/api/read实现。
问题是我得到的HTML文件带有(可能是)cookie接受表(完整SPA)而不是XML,可以在浏览器中显示。
我用于此任务的代码是:
final String uri = "https://gandalf-57.tumblr.com/api/read";
URL url = new URL(uri);
HttpURLConnection conn = (HttpURLConnection) url.openConnection();
conn.setDoOutput(true);
conn.setRequestMethod("GET");
conn.setRequestProperty("Accept", "application/xml;");
conn.setUseCaches(false);
conn.setAllowUserInteraction(false);
InputStreamReader in = new InputStreamReader(conn.getInputStream());
BufferedReader br = new BufferedReader(in);
String output;
while ((output = br.readLine()) != null) {
System.out.println(output);
}
in.close();
conn.disconnect();
编辑:
我得到的html文件是该网站的正文:https://www.tumblr.com/privacy/consent?redirect=https%3A%2F%2Fgandalf-57.tumblr.com%2Fapi%2Fread