C#XmlReader无法将“ <”读取为InnerXmlText

时间:2019-12-28 19:38:26

标签: c# xml exception xml-parsing xmlexception

我写了一个XML解析器,在InnerXml中我得到了这样的文本:

<Name ...><<interface>>Employee</Name>
<!-- "<<interface>>Employee" is the InnerXml Text and I need it as string -->

我的阅读文本代码如下:

     string getName(XmlReader reader)
        {
            string className;
            while (reader.Read())
            {
                if (reader.HasValue)
                {
                    className += reader.Value;
                }
            }
            return className;
        }

但是在我的XmlTextReader阅读此行之后,我遇到了异常:

Nachricht: 
    System.Xml.XmlException : Ein Name darf nicht mit dem Zeichen '<', hexadezimaler Wert 0x3C, beginnen.

表示'<'字符不可读或文本不能以'<'字符开头。 有人可以向我解释一下吗? 基本上,它是将自身转换为XML文件中的内容:

<Name...>&lt;&lt;interface&gt;&gt;Employee</Name> <!-- instead of <<interface>> -->

整个.grapml文件(这是一个不同的xml表示法): (位于y:NodeLabel)

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<graphml xmlns="http://graphml.graphdrawing.org/xmlns" xmlns:java="http://www.yworks.com/xml/yfiles-common/1.0/java" xmlns:sys="http://www.yworks.com/xml/yfiles-common/markup/primitives/2.0" xmlns:x="http://www.yworks.com/xml/yfiles-common/markup/2.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:y="http://www.yworks.com/xml/graphml" xmlns:yed="http://www.yworks.com/xml/yed/3" xsi:schemaLocation="http://graphml.graphdrawing.org/xmlns http://www.yworks.com/xml/schema/graphml/1.1/ygraphml.xsd">
  <!--Created by yEd 3.19.1-->
  <key for="port" id="d0" yfiles.type="portgraphics"/>
  <key for="port" id="d1" yfiles.type="portgeometry"/>
  <key for="port" id="d2" yfiles.type="portuserdata"/>
  <key attr.name="url" attr.type="string" for="node" id="d3"/>
  <key attr.name="description" attr.type="string" for="node" id="d4"/>
  <key for="node" id="d5" yfiles.type="nodegraphics"/>
  <key for="graphml" id="d6" yfiles.type="resources"/>
  <key attr.name="url" attr.type="string" for="edge" id="d7"/>
  <key attr.name="description" attr.type="string" for="edge" id="d8"/>
  <key for="edge" id="d9" yfiles.type="edgegraphics"/>
  <graph edgedefault="directed" id="G">
    <node id="n0">
      <data key="d5">
        <y:UMLClassNode>
          <y:Geometry height="116.0" width="131.0" x="1301.3333333333333" y="41.0"/>
          <y:Fill color="#FFCC00" transparent="false"/>
          <y:BorderStyle color="#000000" type="line" width="1.0"/>
          <y:NodeLabel alignment="center" autoSizePolicy="content" fontFamily="Dialog" fontSize="12" fontStyle="bold" hasBackgroundColor="false" hasLineColor="false" height="33.40234375" horizontalTextPosition="center" iconTextGap="4" modelName="internal" modelPosition="c" textColor="#000000" verticalTextPosition="bottom" visible="true" width="82.052734375" x="24.4736328125" xml:space="preserve" y="3.0">&lt;&lt;interface&gt;&gt;
Employee</y:NodeLabel>
          <y:UML clipContent="true" constraint="" hasDetailsColor="false" omitDetails="false" stereotype="" use3DEffect="true">
            <y:AttributeLabel xml:space="preserve">+name:string
+age:int</y:AttributeLabel>
            <y:MethodLabel xml:space="preserve">getName(value:string):String
getTitle():String
getStaffNo():Int
getRoom():String
getPhone()</y:MethodLabel>
          </y:UML>
        </y:UMLClassNode>
      </data>
    </node>
  </graph>
  <data key="d6">
    <y:Resources/>
  </data>
</graphml>

我的单元测试代码如下:


      public T checkInterfaceOrClass<T> (XmlReader reader, string filepath) where T : BaseModel
        {
            //reader.Settings.IgnoreWhitespace = true;
                    while (reader.Read())
                    {
                        if (getName(reader).Contains("interface"))
                        {
                            InterfaceModel interfaceModel = new InterfaceModel(getName(reader));
                            return (T)Convert.ChangeType(interfaceModel, typeof(InterfaceModel));
                        }
                        else
                        {
                            ClassObject classModel = new ClassObject(getName(reader));
                            return (T)Convert.ChangeType(classModel, typeof(ClassObject));
                        }
                    }
                }
            return null;
        }

1 个答案:

答案 0 :(得分:1)

在评论之后,我编写了一个简单的代码段(使用ReadToDescendant方法跳过文件的整个结构),效果很好

var xmlReader = XmlReader.Create("...");
bool canRead = xmlReader.ReadToDescendant("y:NodeLabel");
if (canRead)
{
    var content = xmlReader.ReadElementContentAsString();
}

元素内容为(字符串中有\n

<<interface>>
Employee

您可以轻松地解析此字符串,并获得带或不带<<interface>>的类名。

仅使用Read方法(如此处),您将获得相同的结果

bool canRead = xmlReader.ReadToDescendant("y:NodeLabel");
if (canRead)
{
    while (xmlReader.Read())
    {
        var content = xmlReader.Value;
    }
}

根据您使用单元测试编辑的内容进行更新。您不需要使用MoveToContent,因为ReadElementContentAsString已经读取了当前元素下的内容。但是主要问题是,根据MSDN

,您多次呼叫ReadElementContentAsString
  

此方法读取开始标记,元素的内容以及   将阅读器移到结束元素标签之外。

因此,第二个调用很可能失败。您只需要阅读一次内容然后对其进行解析,而不是多次阅读