查询生成'XDMP-CHILDNODEKIND:$ final-元素节点不能具有二进制节点子节点'错误

时间:2019-05-16 14:23:38

标签: xquery marklogic marklogic-8

下面是我的简单查询,它从目录中读取所有文件,并将所有文件保存在$ final变量中,并保存在一个文件中。

但是,运行此查询时,花了一些时间后,它提示 [1.0-ml] XDMP-CHILDNODEKIND:$ final-元素节点不能具有二进制节点子节点错误。

let $input-dir :=xdmp:filesystem-directory("d:\work\may\06-05-2019\all- 
 feeds-input-output\clc\log\clc-true-ouput\")/dir:entry
let $final :=      
      for $each at $i in $input-dir
      return  
        xdmp:document-get($each/dir:pathname/text(), 
          <options xmlns="xdmp:document-get">
            <repair>full</repair>
            <encoding>UTF-8</encoding>
          </options>)
return 
  xdmp:save("D:\WORK\MAY\06-05-2019\ALL-FEEDS-INPUT-OUTPUT\CLC\LOG\COMBINE-XMLs\Combine-CLC-TRUE-INPUT.xml", 
       document{<records>{$final}</records>})

实际上,我在本地系统中有10000个小文件,我想合并为一个文件。

1 个答案:

答案 0 :(得分:2)

该目录可能包含二进制文档(即PDF,图像等)。当您使用xdmp:document-get()阅读这些文档时,将得到一个binary()节点。

如错误消息所示,binary()节点不能是XML元素的子级。

您的$final变量将是一系列文档,并且其中至少一个是binary()节点。

您可以排除那些binary()节点。例如,通过向xdmp:document-get()的结果中添加谓词过滤器:

let $final :=      
  for $each at $i in $input-dir
  return 
    xdmp:document-get($each/dir:pathname/text(), 
      <options xmlns="xdmp:document-get">
        <repair>full</repair>
        <encoding>UTF-8</encoding>
      </options>
    )[not(. instance of binary())]

或者您可以base64 encode二进制数据,以便可以将其添加到XML:

let $final :=      
  for $each at $i in $input-dir
  let $doc := 
    xdmp:document-get($each/dir:pathname/text(), 
      <options xmlns="xdmp:document-get">
        <repair>full</repair>
        <encoding>UTF-8</encoding>
      </options>)
  return
    if ($doc instance of binary()) 
    then xdmp:base64-encode($doc)
    else $doc