MarkLogic - xdmp缓慢:文档过滤器

时间:2018-04-16 10:24:57

标签: marklogic

使用ML版'8.0-8'

xdmp:document-filter()非常慢。 对于2 MB文件,过滤内容需要2.0秒。

注意:

  • PDF文档主要包含文本数据
  • 该函数的第二个参数是()

请帮帮我,有什么我需要知道的,以使其更快地工作,还是有更快的其他API?

更新

我有一个ML REST API。这将以二进制文件1 XML1 PDF为准。

然后,它将使用xdmp:document-filter()从PDF中提取内容,并使用mem函数将其插入到XML中。

然后将XML和PDF都插入到数据库中。

1 个答案:

答案 0 :(得分:1)

xdmp:document-filter()速度取决于文档大小,因为它以XHTML格式返回元数据和文本。

您可以使用MarkLogic的CPF功能,它将在后端执行这些操作。