CPF将PDF转换为XHTML。这很好,当它在XHTML中时,我有另一个管道来丰富数据。这也很好。
我注意到我没有从PDF转换管道获取原始文档URI,只获取XHTML文件的URI。
我可以做的是使用替换构造转换XHTML URI,但我宁愿在所有管道中保留原始URI:
/converted/Berry, Steve - Het Venetiaans bedrog_pdf.xhtml
into
/pdf/Berry, Steve - Het Venetiaans bedrog.pdf
我已经看了/MarkLogic/conversion/actions/convert-pdf-action.xqy
,但我不清楚我应该在哪里添加一些代码。
欢迎任何建议!
答案 0 :(得分:2)
由于您已经在使用CPF,因此您已经拥有了属性片段。我建议您保留您可能想要的任何此类信息作为财产。同样,您也可以在第一步添加一个集合,并将其复制到上一步中的每个新创建的文档中。
这些方法中的任何一种都可以将原始URI作为一种归类ID
结束