用Jsoup选择Html标签

时间:2016-11-22 00:01:00

标签: java jsoup

我想用Jsoup

选择所有Html标签代码
<html>
 <head></head>
 <body>
 .....
 </body>
</html>

我试过了:

Document dc = Jsoup.parse(fichier, "utf-8");
String tags = dc.outerHtml();

1 个答案:

答案 0 :(得分:1)

您的问题不清楚,但似乎您只想获取所有标记节点名称,为此您可以解析html和forEach然后迭代列表元素获取{{1每一个,使用java 8来利用import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.select.Elements; public class JSoup { public static void main(String[] args) { String fichier = "<html>" + "<head></head>" + "<body></body>" + "</html>"; Document dc = Jsoup.parse(fichier, "utf-8"); Elements elements = dc.getAllElements(); elements.forEach( element -> System.out.println(element.nodeName())); } } 你的代码可能是这样的:

#document
html
head
body

此代码打印所有标记节点名称:

{{1}}