我希望抓取整个网站并将其保存在本地离线状态。它应该有两部分:
这需要使用Java实现,我需要覆盖HttpsURLConnection逻辑以添加几行身份验证(Hadoop)以获取url响应(keytabs)。如下所示:
AuthenticatedURL.Token token = new AuthenticatedURL.Token();
URL ur = new URL(url);
//HttpsURLConnection.setDefaultHostnameVerifier(new HostnameVerifierSSL());
HttpsURLConnection con = (HttpsURLConnection) new AuthenticatedURL().openConnection(ur, token);
让我知道可能的解决方案。