jsoup.Parse不能处理iframe元素

时间:2018-01-09 02:42:49

标签: java jsoup

我正在尝试解析HTML文件。 HTML包含iframe内容。但是jsoup.parse()正在处理除iframe元素之外的所有元素。谁可以帮我这个事。 例如:

String html = "<iframe src='demo_iframe.htm' height='200' width='300'></iframe>";
String doc = Jsoup.parse(html).text();
System.out.println(doc);

The output should look like:

demo_iframe.htm身高:200宽度:200

1 个答案:

答案 0 :(得分:0)

您必须选择iframe元素。这是解决方案

String html = "<iframe src='demo_iframe.htm' height='200' width='300'></iframe>";
    Document doc = Jsoup.parse(html);
    Element iframe = doc.select("iframe").first();
    String iframeSrc = iframe.attr("src");
    String height = iframe.attr("height");
    String width = iframe.attr("width");
    System.out.println(iframeSrc + " height:" + height + " width:" + width);

Use selector-syntax to find elements