我如何使用HTMLUnit从java servlet生成的网页中获取数据。我在尝试阅读网页时遇到错误。 / getSurvey是创建网页的servlet,但是如何访问从servlet生成的HTML。
最终WebClient webClient = new WebClient(); final HtmlPage page = webClient.getPage(“http://survey-creator.appspot.com/getSurvey”);
答案 0 :(得分:0)
HtmlUnit并非真正“只是”HTML解析器。它是一种程序化的webbrowser。它旨在使用Java语言以编程方式浏览网页和/或填写Web表单。如果您的唯一目的是将HTML作为字符串,请使用真正的HTML解析器。我可以为此推荐Jsoup。
String html = Jsoup.connect("http://stackoverflow.com").get().html();
就是这样。然而,它可以做更多的事情,例如selecting elements of interest。