我试图使用docx4j将word文件转换为pdf,到目前为止我已经成功转换了doc和docx文件,但是当我尝试加载odt文件时,我得到了
InvalidFormatException: Bad [Content_Types].xml
通过使用zip打开odt文件,我可以看到content.xml
文件(但不是content_types.xml
)
这就是我如何加载文件:
WordprocessingMLPackage wordMLPackage = WordprocessingMLPackage.load(new java.io.File(inputfilepath));
答案 0 :(得分:1)
ODT与OOXML的格式不同。
.ODT是 Office应用程序的打开文档格式(ODF)的文字处理文件格式,也称为OpenDocument,这是一种基于XML的电子表格,图表,演示文稿和单词的文件格式处理文件。
Office Open XML(OOXML)是一种基于XML的文件格式,用于表示文字处理文档,电子表格和演示文稿(.docx,.xlsx和.pptx)。它在概念上与ODF在很多方面类似,尽管很多细节都不同。 OOXML由Microsoft创建,自2007年以来一直用作所有Office版本的默认格式。
ODF vs OOXML是一场持续的标准之战,你应该记录下来。
答案 1 :(得分:0)
odt文件是OpenOffice / LibreOffice文件,而不是Microsoft Word OpenXML文件。
docx4j不处理odt文件。