OpenXmlReader.Skip应该如何工作?

时间:2016-02-05 17:38:39

标签: c# xml openxml xlsx xmlreader

来自documentation

  

跳过当前节点的子元素

这是代码:

var reader = DocumentFormat.OpenXml.OpenXmlReader.Create(worksheetPart);

// Header
while (reader.Read())
{
    if (reader.ElementType == typeof (Row)) // reader is at row r="1"
    {
        headers = GetHeaders((Row)reader.LoadCurrentElement(), _doc.WorkbookPart);
        reader.ReadNextSibling(); // reader is at row r="2"
        break;
    }
}

//...
reader.Skip(); // reader is at row r="3"

工作表xml(剪切):

<x:sheetData xmlns:x="http://schemas.openxmlformats.org/spreadsheetml/2006/main">
  <x:row r="1" spans="1:1">
      <x:c r="A1" s="1" t="s">
        <x:v>36</x:v>
      </x:c>
  </x:row>
  <x:row r="2" spans="1:1"> <!-- before calling Skip reader is here -->
      <x:c r="A2" s="1" t="s">
        <x:v>38</x:v>
      </x:c>
  </x:row> <!-- I expect reader to be here after calling Skip because closing tag != child element -->
  <x:row r="3" spans="1:1"> <!-- after calling Skip reader goes here -->
      <x:c r="A3" s="1" t="s">
        <x:v>38</x:v>
      </x:c>
  </x:row>
</x:sheetData>

为什么Skip也会跳过</x:row>

2 个答案:

答案 0 :(得分:3)

<x:row>是开始标记(标记开头),</x:row>是XML文件中一个元素的结束标记(标记结束)。

解析XML文档后,它表示为节点对象树,每个节点都有父节点,兄弟节点和子节点。

所以不要将表示形式混淆为内存中的树,表示为文件。

答案 1 :(得分:0)

这是一个小的扩展方法,可以跳到类型为T的元素的下一个标记。标记可以是开始标记或结束标记。 (注意:如果没有该类型的标签,则它将跳到文档的末尾)

public static void SkipTo<T>(this OpenXmlReader reader) where T : OpenXmlElement
{
    while (reader.Read() && reader.ElementType != typeof(T))
        ;
}

通常在阅读时你知道当前元素的类型:

if (reader.ElementType == typeof(PivotFields) && !reader.IsEndElement)
{
    // some code ...
    reader.SkipTo<PivotFields>(); // reader is now at </x:pivotFields>
    // some code ...
}