我正在使用w3c DOM遍历一个xml文档,我需要将org.w3c.dom.Element
内的文本内容的子字符串包含一些基于某些业务逻辑的标记。
例如,我想转
<title id="1">Java is a cool programming language</title>
进入
<title id="1">Java is a <blah id="2">cool</blah> programming language</title>
我并不坚持在我的应用程序中使用w3c DOM库,因此欢迎任何可以实现此目的的其他库的建议。
答案 0 :(得分:1)
解析器将解析XML文档中的所有文本。
但解析器将忽略CDATA部分内的文本。
试试这个
<title id="1">Java is a <![CDATA[<blah id="2">cool</blah> ]]>programming language</title>
答案 1 :(得分:0)
通常,您使用<
和>
(和其他人)在节点值中构建此类标记。这些被称为'实体参考。有关它们的一些信息,请参见here; Google / Bing / YourFavouriteSearchEngine了解更多详情。
在您的示例中,这意味着您将使用:
<title id="1">Java is a <blah id="2">cool</blah> programming language</title>
干杯, 维姆