使用HTML标记反序列化XML

时间:2012-04-17 21:37:28

标签: html deserialization xml-deserialization

我想知道一个解决方案来反序列化XML元素中HTML的值。 我的样本XML如下所示,

<root>
<Element>
<P>This <i>is </i> a sample <B>XML Tag</B><P>
</Element>
<root>

我希望这个“

这个样本 XML标记

”作为字符串。请建议我的解决方案。我无法在XML文件中添加cdata。

2 个答案:

答案 0 :(得分:0)

您需要使用转义字符:

"   &quot;
'   &apos;
<   &lt;
>   &gt;
&   &amp;

完整参考:

http://en.wikipedia.org/wiki/List_of_XML_and_HTML_character_entity_references

答案 1 :(得分:0)

您可以使用HSharp反序列化HTML和XML HSharp是一个用于轻松快速地分析HTML等标记语言的库。安装:Install-Package Obisoft.HSharp
在GitHub中查看:enter link description here

您想要的代码应该是这样的:

        var DeResult = HtmlConvert.DeserializeHtml("<root>...</root>");//fill it
        Console.WriteLine(DeResult["root"]["element"]["p"].Son);