标签: marklogic marklogic-8
我正在使用xdmp:document-filter从二进制文档中提取文本。这很好用,但我有一个问题,在PPTX中,如果有人嵌入了由excel表支持的excel图表,PPTX也会嵌入excel电子表格。现在xdmp:document-filter确实从嵌入文档中提取数据。有没有办法让我不提取嵌入的文档?
xdmp:document-filter
答案 0 :(得分:1)
您能在输出XML中识别嵌入的文档吗?如果是这样,您可以使用XQuery删除嵌入的文档吗?