我正在尝试解析HTML文件。 HTML包含iframe内容。但是jsoup.parse()正在处理除iframe元素之外的所有元素。谁可以帮我这个事。 例如:
String html = "<iframe src='demo_iframe.htm' height='200' width='300'></iframe>";
String doc = Jsoup.parse(html).text();
System.out.println(doc);
The output should look like:
demo_iframe.htm身高:200宽度:200
答案 0 :(得分:0)
您必须选择iframe
元素。这是解决方案
String html = "<iframe src='demo_iframe.htm' height='200' width='300'></iframe>";
Document doc = Jsoup.parse(html);
Element iframe = doc.select("iframe").first();
String iframeSrc = iframe.attr("src");
String height = iframe.attr("height");
String width = iframe.attr("width");
System.out.println(iframeSrc + " height:" + height + " width:" + width);