管道PDF转换原始文档URI

时间:2016-09-06 16:51:12

标签: marklogic

CPF将PDF转换为XHTML。这很好,当它在XHTML中时,我有另一个管道来丰富数据。这也很好。

我注意到我没有从PDF转换管道获取原始文档URI,只获取XHTML文件的URI。

我可以做的是使用替换构造转换XHTML URI,但我宁愿在所有管道中保留原始URI:

/converted/Berry, Steve - Het Venetiaans bedrog_pdf.xhtml

into

/pdf/Berry, Steve - Het Venetiaans bedrog.pdf

我已经看了/MarkLogic/conversion/actions/convert-pdf-action.xqy,但我不清楚我应该在哪里添加一些代码。

欢迎任何建议!

1 个答案:

答案 0 :(得分:2)

由于您已经在使用CPF,因此您已经拥有了属性片段。我建议您保留您可能想要的任何此类信息作为财产。同样,您也可以在第一步添加一个集合,并将其复制到上一步中的每个新创建的文档中。

这些方法中的任何一种都可以将原始URI作为一种归类ID

结束