解析xml java时出现异常

时间:2016-08-11 13:21:01

标签: java xml string character-encoding escaping

我正在尝试使用DocumentBuilder解析内容。

<html>
<head>
<meta charset="utf-8" />
<title>Test</title>
</head>
<body>
<img height="" src="google.gif?<>" />
</body>
</html>

我在解析它时遇到异常,src不能包含&lt;。我在应用XSL时需要解析它。

有没有办法做到这一点。截至目前,我首先使用DocumentBuilder解析它并再次转义它。

我从数据库中检索字符串格式的上述XML。现在当我尝试使用DocumentBuilder解析它时,我得到一个src不能包含<的异常。我试图使用StringEscapeUtils.EscapeHtml来逃避它,但它正在逃避完整的String并且DocumentBuilder再次无法解析它。请让我知道如何仅从HTML解析src,因为我无法完成它。

1 个答案:

答案 0 :(得分:4)

这些符号<article class="portfolio-item pf-audio" style="position: absolute; left: 212px; top: 0px;"></article> <article class="portfolio-item pf-websites" style="position: absolute; left: 424px; top: 0px;"></article> 是用于XML中标记的预定义实体。你必须使用特殊符号。详细了解Wikipedia

    {li> <> &gt; {li> > &lt; {li> < &quot; {li> " &apos; {li> ' &amp;

您的代码最终将成为:

&
相关问题