例如,对于HTML文档:
<html>
<body>
<p>Hello <b>world</b></p>
</body>
</html>
我知道我可以使用getTextContent()
获取"Hello world"
,但有没有办法获得"Hello <b>world</b>"
?
答案 0 :(得分:1)
在Java中,您可以应用XSLT转换:https://docs.oracle.com/javase/tutorial/jaxp/xslt/writingDom.html
您需要检索元素子树的XML内容。 SO解决这个问题有几个问题: How to I output org.w3c.dom.Element to string format in java?