我正在使用MarkLogic为PDF文档生成XML文件,其中包含图像,格式化文本(斜体和粗体),表格等。您能否提供一些最佳转换指南。我使用以下管道进行正常转换:
图像不会以其标题和格式进行维护,也不会保留。表格在生成的XML中显示为正常段落。
答案 0 :(得分:2)
文档转换的一部分是构建 CSS 文件来处理格式化,以及抓取文档中的图像。两者都进入数据库。使用浏览器查看文档时,请确保指向图像的链接和 CSS 有效。您可能需要将其从/doc1.css
更改为/get.xqy?uri=doc1.css
之类的内容。此外,页面上的其他 CSS 可能会干扰文档的 CSS 。