Java简单的GET请求返回完整的SPA而不是XML

时间:2019-10-23 21:47:14

标签: java html xml rest get

我想做一个简单的REST解析器。

我在从https://www.tumblr.com接收信息时遇到问题。我想获取具有用户帖子完整历史记录的XML文件,可以通过https://[user-name].tumblr.com/api/read实现。

问题是我得到的HTML文件带有(可能是)cookie接受表(完整SPA)而不是XML,可以在浏览器中显示。

我用于此任务的代码是:

          final String uri = "https://gandalf-57.tumblr.com/api/read";
          URL url = new URL(uri);
          HttpURLConnection conn = (HttpURLConnection) url.openConnection();

          conn.setDoOutput(true);
          conn.setRequestMethod("GET");
          conn.setRequestProperty("Accept", "application/xml;");
          conn.setUseCaches(false);
          conn.setAllowUserInteraction(false);

          InputStreamReader in = new InputStreamReader(conn.getInputStream());
          BufferedReader br = new BufferedReader(in);
          String output;
          while ((output = br.readLine()) != null) {
              System.out.println(output);
          }
          in.close();
          conn.disconnect();

编辑:

我得到的html文件是该网站的正文:https://www.tumblr.com/privacy/consent?redirect=https%3A%2F%2Fgandalf-57.tumblr.com%2Fapi%2Fread

0 个答案:

没有答案