我正在使用docx4j 6.1.2和docx4j-export-fo 8.1.2(apache FOP 2.3)将一些worddocument(docx)转换为具有Java 11的PDF,如下所示:
// Load File
var wordMLPackage = WordprocessingMLPackage.load(wordDocument.getInputStream());
// Convert to PDF
var out = new FastByteArrayOutputStream();
Docx4J.toPDF(wordMLPackage, out);
return new ByteArrayResource(out.toByteArray());
在生成的PDF的所有段落中,存在一个格式问题,我无法控制。下图显示了Word中docx的一部分。
下一张图片显示了pdf文件中的部分。
有什么想法吗?
编辑1:
docx文件在这里:https://filebin.net/cux9s1p5ufm1vgul。
答案 0 :(得分:2)
<dependency>
<groupId>org.docx4j</groupId>
<artifactId>docx4j-export-fo</artifactId>
<version>6.1.0</version>
</dependency>
可以。
问题似乎是https://github.com/plutext/docx4j-export-FO/commit/4451111aa02a698ed54788299513f7eac74bd996#diff-eeb9c00a64479f4ff29769e29a6a0cd7R455引入的white-space-collapse =“ false” white-space-treatment =“ preserve”