我试图在.NET环境中使用C#解析XML文件,并且它不断跳过元素

时间:2014-08-05 23:02:42

标签: c# .net xml xml-parsing xmlreader

所以这就是我试图解析的XML的一部分看起来像:

<azsa:Views>
   <azsa:Spatial_Array>
      <azsa:Spatial>
         <azsa:ViewName>Spatial</azsa:ViewName>
            <azsa:BBox>
               <azsa:PointLo>
                 <azsa:x>0</azsa:x>
                 <azsa:y>0</azsa:y>
                 <azsa:z>0</azsa:z>
                </azsa:PointLo>
               <azsa:PointHi>
                 <azsa:x>2925</azsa:x>
                 <azsa:y>3375</azsa:y>
                 <azsa:z>2775</azsa:z>
               </azsa:PointHi>
             </azsa:BBox>
       </azsa:Spatial>
    </azsa:Spatial_Array>
</azsa:Views>

我必须读取PointHi和PointLo的x,y和z坐标

我使用XMLReader()类来执行任务。

XmlTextReader reader = new XmlTextReader(openFileDialog1.FileName);

 while (reader.Read())
 {
   reader.ReadToFollowing("azsa:Views");
   reader.ReadToFollowing("azsa:Spatial_Array");
   reader.ReadToFollowing("azsa:Spatial");
   reader.ReadToFollowing("azsa:ViewName");
   reader.ReadToFollowing("azsa:BBox");
   reader.ReadToFollowing("azsa:PointLo");
   reader.ReadToFollowing("azsa:x");
   low[0] = (int)(Double.Parse(reader.ReadElementString()));
   reader.ReadToFollowing("azsa:y");
   low[1] = (int)(Double.Parse(reader.ReadElementString()));
   reader.ReadToFollowing("azsa:z");
   low[2] = (int)(Double.Parse(reader.ReadElementString()));
   reader.ReadToFollowing("azsa:PointHi");
   reader.ReadToFollowing("azsa:x");
   high[0] = (int)(Double.Parse(reader.ReadElementString()));
   reader.ReadToFollowing("azsa:y");
   high[1] = (int)(Double.Parse(reader.ReadElementString()));
   reader.ReadToFollowing("azsa:z");
   high[2] = (int)(Double.Parse(reader.ReadElementString()));
}

读者完美地工作直到它到达PointLo中的第一个x,然后它只是跳到PointHi中的y。我尝试过使用后代,子树和readinnerxml,但它仍然做同样的事情。

注意:1。while循环中有更多代码用于读取XML的剩余部分,但对于此问题不是必需的,因此我没有将其包含在帖子中。 2.改变XML的组织方式是不可能的,因为它是如何为我正在执行的任务存储它们的方式。 3. XMLReader是更好的方法,因为我正在处理大量文档,并且没有使用缓存的空间。

2 个答案:

答案 0 :(得分:0)

在阅读子树时,我有一段相似的问题。该场景中的解决方案是配置子树XmlReaders。当然,这里的情况略有不同,但你能考虑下面的方法(注意我为了简化测试而删除了元素前缀,以及读取XML字符串而不是文件)?

这看起来确实很难看,但这更像是一个概念证明,可以稍微整理一下。它也缺乏适当的错误检查,但这再次出于演示目的。它至少解析出不同的点值。

作为旁注,我想也许可以通过使用类来表示XML流中的不同组件(或对象),并使这些类负责解析自己的属性来抽象出许多丑陋。 / p>

只有一种方式(很多我确定)给猫皮肤......

private void ParseXml(string xml)
{
    double[] low = null;
    double[] hi = null;

    using (StringReader stringReader = new StringReader(xml))
    {
        using (XmlReader xmlReader = XmlReader.Create(stringReader))
        {
            while (xmlReader.Read())
            {
                if (xmlReader.NodeType != XmlNodeType.Element) continue;

                if (xmlReader.Name == "PointLo")
                {
                    low = ParsePoint(xmlReader);
                }
                else if (xmlReader.Name == "PointHi")
                {
                    hi = ParsePoint(xmlReader);
                }
            }
        }
    }
}

private double[] ParsePoint(XmlReader xmlReader)
{
    double[] point = new double[3];

    using (XmlReader pointReader = xmlReader.ReadSubtree())
    {
        while (pointReader.Read())
        {
            if (pointReader.NodeType != XmlNodeType.Element) continue;

            if (pointReader.Name == "x")
            {
                point[0] = GetDimensionValue(pointReader);
            }
            else if (pointReader.Name == "y")
            {
                point[1] = GetDimensionValue(pointReader);
            }
            else if (pointReader.Name == "z")
            {
                point[2] = GetDimensionValue(pointReader);
            }
        }
    }

    return point;
}

private double GetDimensionValue(XmlReader reader)
{
    using (XmlReader dimensionReader = reader.ReadSubtree())
    {
        dimensionReader.Read();

        return reader.ReadElementContentAsDouble();
    }
}

答案 1 :(得分:0)

正如我在对manderson的解决方案的评论中提到的那样,由于某种原因,它没有将y元素视为元素,而是将其视为文本元素,我对while循环进行了以下更改: ParsePoint()

                 while (pointReader.Read())
                  {
                    if (pointReader.NodeType == XmlNodeType.Element || pointReader.NodeType== XmlNodeType.Text)
                     {

                      if (pointReader.Name == "azsa:x")
                       {
                          point[0] = pointReader.ReadElementContentAsDouble();
                       }
                      else if (pointReader.Name == "")
                       {
                          point[1] = Double.Parse(pointReader.Value);
                       }
                     else if (pointReader.Name == "azsa:z")
                       {
                     point[2] = pointReader.ReadElementContentAsDouble();
                       }
                    }
                 }

虽然我没有声称这是执行此操作的理想方式,但它适用于我正在处理的XML文件。我还删除了GetDimensionValue方法,只是读取了这个方法本身的值/元素内容。