当我在纯文本电子邮件节点上执行xdmp:document-filter()
时,最多需要一秒钟来提取元数据。我已经创建了一个使用此函数更新文档的提交后触发器。如果没有触发器,mlcp会快50倍,并且没有超时错误。
是否可以指定有助于加快功能的选项。 e.g。
xdmp:document-filter(doc('/some-uri'),
<options ...>
<data-type>email</data-type>
</options>)
答案 0 :(得分:2)
我建议使用MLCP转换来运行此文档过滤功能。触发器占用开销,任务服务器将与您的MLCP摄取竞争资源。
在变换中进行变换后,您可以向上或向下调整MLCP以找到最佳摄取速度。我通常采用等于总vm /超线程内核的多个线程。您也可以考虑使用-fastload ..
HTH!