Question

CPF将PDF转换为XHTML。这很好，当它在XHTML中时，我有另一个管道来丰富数据。这也很好。

我注意到我没有从PDF转换管道获取原始文档URI，只获取XHTML文件的URI。

我可以做的是使用替换构造转换XHTML URI，但我宁愿在所有管道中保留原始URI：

/converted/Berry, Steve - Het Venetiaans bedrog_pdf.xhtml

into

/pdf/Berry, Steve - Het Venetiaans bedrog.pdf

我已经看了/MarkLogic/conversion/actions/convert-pdf-action.xqy，但我不清楚我应该在哪里添加一些代码。

欢迎任何建议！

Answer 1

由于您已经在使用CPF，因此您已经拥有了属性片段。我建议您保留您可能想要的任何此类信息作为财产。同样，您也可以在第一步添加一个集合，并将其复制到上一步中的每个新创建的文档中。

这些方法中的任何一种都可以将原始URI作为一种归类ID

结束