如何阅读CDATA XML内容

时间:2010-02-16 11:49:47

标签: .net xml c#-2.0 whitespace cdata

我有以下xml文件:

<?xml version="1.0" encoding="utf-8"?>
    <root>
<phrase id="test"><![CDATA[test]]></phrase>
<phrase id="test0"><![CDATA[test0]]></phrase>
<phrase id="test2"><![CDATA[test2]]></phrase>
<phrase id="test3">test3</phrase>
<phrase id="test4">
    <![CDATA[test4
LINEBREAK]]>
</phrase>
<phrase id="test5">
LINEBREAK</phrase>
<phrase id="test6"><![CDATA[test6]]></phrase>
<phrase id="test7">
    <![CDATA[test7
ANOTHER LINEBREAK]]>
</phrase>
</root>

如您所见,emelemts CAN包含cdata部分以正确包装换行符和空格。问题是,如果我使用以下代码,也会捕获CData之前和之后的换行符和制表符。

所以我决定使用IgnoreWhitespace=true,但这会跳过每一个节点。那是为什么?

XmlReaderSettings sett = new XmlReaderSettings();
sett.IgnoreWhitespace = true;
using (XmlReader r = XmlTextReader.Create(filePath, sett))
{
    while (r.ReadToFollowing("phrase"))
    {
        string attrib = r.GetAttribute("id").ToLowerInvariant();
        string content = r.ReadElementContentAsString();
    }
}

请注意,我的项目仅限于.net 2.0

1 个答案:

答案 0 :(得分:1)

尝试使用ReadString代替ReadElementContentAsString

while (r.ReadToFollowing("phrase"))
{
    string attrib = r.GetAttribute("id").ToLowerInvariant();
    string content = r.ReadString();
}