如何从WebView检索HTML内容(作为字符串)

时间:2011-03-10 18:38:11

标签: android webview android-webview

如何检索当前在WebView中显示的所有HTML内容?

我找到了WebView.loadData(),但我找不到相反的等价物(例如WebView.getData())

请注意,我有兴趣检索那些我无法控制的网页数据(即我不能在这些页面中注入Javascript函数,以便在WebView中调用Javascript接口)。

6 个答案:

答案 0 :(得分:32)

您可以通过以下方式实现这一目标:

final Context myApp = this;

/* An instance of this class will be registered as a JavaScript interface */
class MyJavaScriptInterface
{
    @SuppressWarnings("unused")
    public void processHTML(String html)
    {
        // process the html as needed by the app
    }
}

final WebView browser = (WebView)findViewById(R.id.browser);
/* JavaScript must be enabled if you want it to work, obviously */
browser.getSettings().setJavaScriptEnabled(true);

/* Register a new JavaScript interface called HTMLOUT */
browser.addJavascriptInterface(new MyJavaScriptInterface(), "HTMLOUT");

/* WebViewClient must be set BEFORE calling loadUrl! */
browser.setWebViewClient(new WebViewClient() {
    @Override
    public void onPageFinished(WebView view, String url)
    {
        /* This call inject JavaScript into the page which just finished loading. */
        browser.loadUrl("javascript:window.HTMLOUT.processHTML('<html>'+document.getElementsByTagName('html')[0].innerHTML+'</html>');");
    }
});

/* load a web page */
browser.loadUrl("http://lexandera.com/files/jsexamples/gethtml.html");

您将在processHTML方法中获得整个Html contnet。 它不会再提出网页请求。所以这也是更有效的方式。

感谢。

答案 1 :(得分:17)

不幸的是,这并不容易。

请参阅How do I get the web page contents from a WebView?

您可以将HttpRequest设置为与WebView相同的页面并获得响应。

答案 2 :(得分:11)

{{1}}

答案 3 :(得分:2)

将此添加到您的代码中:

private String getUrlSource(String site) throws IOException {
    //GNU Public, from ZunoZap Web Browser
    URL url = new URL(site);
    URLConnection urlc = url.openConnection();
    BufferedReader in = new BufferedReader(new InputStreamReader(
    urlc.getInputStream(), "UTF-8"));
    String inputLine;
    StringBuilder a = new StringBuilder();
    while ((inputLine = in.readLine()) != null)
    a.append(inputLine);
    in.close();

    return a.toString();
}

然后让我们告诉您如何获得Google的来源:

getURLSource("http://google.com");

答案 4 :(得分:1)

您可以拦截WebView发出的HTTP请求,然后修改HTML以包含与HTML页面通信所需的任何JavaScript函数。您可以通过WebViewClient shouldInterceptRequest()方法拦截HTTP请求。

使用此机制,您可以通过自己加载来访问加载的页面,在将其传递到WebView之前对其进行修改,甚至可以根据需要在本地缓存它。

答案 5 :(得分:0)

你可以从webview通过JavaScriptInterface传递数据..我已经完成了这个。 将数据保存到静态变量然后在android applcation下处理