XQuery:如何将大型xml文件拆分为较小的文件

时间:2015-10-12 12:26:41

标签: xml xquery

我们有非常大的数据文件,例如:

<itemList>
 <item>A1</item>
 <item>A2</item>
 <item>A3</item>
 <item>...</item>
 <item>A6000</item>
</itemList>

我们必须将它们分成更小的块,每块大小为1000。所以它看起来像这样:

<itemList>
 <itemSet>
  <item>A1</item>
  <item>...</item>
  <item>A1000</item>
 <itemSet>
 <itemSet>
  <item>...</item>

在XQuery中拆分它的最佳方法是什么?有什么想法吗?

非常感谢

2 个答案:

答案 0 :(得分:4)

我建议使用窗口查询:

<itemList>
{
    for tumbling window $items in $document/item
    start at $i when true()
    end at $j when $j eq $i + 999
    return
        <itemSet>
        {
                $items
        }
        </itemSet>
}
</itemList>

您可以使用Zorba here(我使用较小的窗口)

进行测试

答案 1 :(得分:4)

窗口化循环是最佳答案(请参阅Ghislain的答案),但这仅适用于XQuery 3,您的处理器可能不支持。在这种情况下,你可以自己动手,就像你用其他任何语言一样:

declare variable $itemList := <itemList>
 <item>A1</item>
 <item>A2</item>
 <item>A3</item>
 <item>A4</item>
 <item>A5</item>
 <item>A6</item>
 <item>A7</item>
 <item>A8</item>
</itemList>;
declare variable $groupSize := 3;

element itemList {
  for $group in (0 to fn:ceiling(count($itemList/item) div $groupSize) - 1)
  let $groupStart := ($group * $groupSize) +1
  let $groupEnd := ($group + 1) * $groupSize
  return
    element itemGroup {
      $itemList/item[$groupStart to $groupEnd]
    }
}