在marklogic

时间:2017-09-26 09:25:22

标签: marklogic marklogic-9

是否有任何方法可以搜索除

之外的PPT,PDF等二进制文件的内容

使用xdmp:document-filter()函数将其转换为X HTML格式并在其上进行搜索?

1 个答案:

答案 0 :(得分:4)

基本上没有。您必须从二进制格式中提取可读文本,以允许MarkLogic对其进行索引。您可以使用xdmp:document-filter()xdmp:pdf-convert()xdmp:word-convert()等函数提取该文本,但无法直接索引二进制节点。

HTH!