我们有非常大的数据文件,例如:
<itemList>
<item>A1</item>
<item>A2</item>
<item>A3</item>
<item>...</item>
<item>A6000</item>
</itemList>
我们必须将它们分成更小的块,每块大小为1000。所以它看起来像这样:
<itemList>
<itemSet>
<item>A1</item>
<item>...</item>
<item>A1000</item>
<itemSet>
<itemSet>
<item>...</item>
在XQuery中拆分它的最佳方法是什么?有什么想法吗?
非常感谢
答案 0 :(得分:4)
我建议使用窗口查询:
<itemList>
{
for tumbling window $items in $document/item
start at $i when true()
end at $j when $j eq $i + 999
return
<itemSet>
{
$items
}
</itemSet>
}
</itemList>
您可以使用Zorba here(我使用较小的窗口)
进行测试答案 1 :(得分:4)
窗口化循环是最佳答案(请参阅Ghislain的答案),但这仅适用于XQuery 3,您的处理器可能不支持。在这种情况下,你可以自己动手,就像你用其他任何语言一样:
declare variable $itemList := <itemList>
<item>A1</item>
<item>A2</item>
<item>A3</item>
<item>A4</item>
<item>A5</item>
<item>A6</item>
<item>A7</item>
<item>A8</item>
</itemList>;
declare variable $groupSize := 3;
element itemList {
for $group in (0 to fn:ceiling(count($itemList/item) div $groupSize) - 1)
let $groupStart := ($group * $groupSize) +1
let $groupEnd := ($group + 1) * $groupSize
return
element itemGroup {
$itemList/item[$groupStart to $groupEnd]
}
}