使用ML版'8.0-8'
xdmp:document-filter()
非常慢。
对于2 MB文件,过滤内容需要2.0秒。
注意:
()
请帮帮我,有什么我需要知道的,以使其更快地工作,还是有更快的其他API?
更新
我有一个ML REST API。这将以二进制文件1 XML
和1 PDF
为准。
然后,它将使用xdmp:document-filter()
从PDF中提取内容,并使用mem
函数将其插入到XML中。
然后将XML和PDF都插入到数据库中。
答案 0 :(得分:1)
xdmp:document-filter()
速度取决于文档大小,因为它以XHTML
格式返回元数据和文本。
您可以使用MarkLogic的CPF功能,它将在后端执行这些操作。