下面是我的简单查询,它从目录中读取所有文件,并将所有文件保存在$ final变量中,并保存在一个文件中。
但是,运行此查询时,花了一些时间后,它提示 [1.0-ml] XDMP-CHILDNODEKIND:$ final-元素节点不能具有二进制节点子节点错误。
let $input-dir :=xdmp:filesystem-directory("d:\work\may\06-05-2019\all-
feeds-input-output\clc\log\clc-true-ouput\")/dir:entry
let $final :=
for $each at $i in $input-dir
return
xdmp:document-get($each/dir:pathname/text(),
<options xmlns="xdmp:document-get">
<repair>full</repair>
<encoding>UTF-8</encoding>
</options>)
return
xdmp:save("D:\WORK\MAY\06-05-2019\ALL-FEEDS-INPUT-OUTPUT\CLC\LOG\COMBINE-XMLs\Combine-CLC-TRUE-INPUT.xml",
document{<records>{$final}</records>})
实际上,我在本地系统中有10000个小文件,我想合并为一个文件。
答案 0 :(得分:2)
该目录可能包含二进制文档(即PDF,图像等)。当您使用xdmp:document-get()
阅读这些文档时,将得到一个binary()
节点。
如错误消息所示,binary()
节点不能是XML元素的子级。
您的$final
变量将是一系列文档,并且其中至少一个是binary()
节点。
您可以排除那些binary()
节点。例如,通过向xdmp:document-get()
的结果中添加谓词过滤器:
let $final :=
for $each at $i in $input-dir
return
xdmp:document-get($each/dir:pathname/text(),
<options xmlns="xdmp:document-get">
<repair>full</repair>
<encoding>UTF-8</encoding>
</options>
)[not(. instance of binary())]
或者您可以base64 encode二进制数据,以便可以将其添加到XML:
let $final :=
for $each at $i in $input-dir
let $doc :=
xdmp:document-get($each/dir:pathname/text(),
<options xmlns="xdmp:document-get">
<repair>full</repair>
<encoding>UTF-8</encoding>
</options>)
return
if ($doc instance of binary())
then xdmp:base64-encode($doc)
else $doc