跳过标记属性中的Html内容

时间:2015-06-11 14:47:26

标签: java saxparser

我正在使用SAX Parser用"描述"解析以下数据。包含HTML内容的属性。但是我得到了错误"属性"描述"与元素类型相关联" null"不得包含'<'字符"

如何在XML处理时使SAX Parser忽略此标记?

<Thread ThreadID="22" Title="google"
                    Description="<a href="http://google.com/">http://google.com/</a>"
                    DisplayName="Sam" LoginID="hjaja" UserEmailID="abx@ers"
                    UserSapCode="12345"
                    IsAnonymous="Yes" CreatedDate="2015-04-29T21:56:04.943" ReplyCount="0"
                    ViewCount="0" PopularityPoints="0" LastUpdatedBy="" LastPostDate="" />

提前致谢。

2 个答案:

答案 0 :(得分:0)

我真的应该看一下这篇文章(HTML code inside XML),看看其他人如何建议解决这个问题。

答案 1 :(得分:0)

没有XML解析器可以解析此数据,因为数据不符合xml格式。请参阅XML specifications

有两种方法可以解决这个问题:

  1. 更改源格式
  2. 更改源以创建正确的XML。您可以通过使用以下内容转义字符来包含HTML:

    "   &quot;
    '   &apos;
    <   &lt;
    >   &gt;
    &   &amp;
    
    1. 更改目标算法
    2. 其次是为你创建自己的解析算法。

      通常答案总是第一个。