我正在获取异常使用Docx4J.load加载.doc文件时获取“此文件似乎是二进制doc / ppt / xls”

时间:2017-09-06 06:49:05

标签: docx4j

使用Docx4J.load加载.doc文件时获取This file seems to be a binary doc/ppt/xls。 我尝试使用docx4j加载.doc,但得到了上述异常。

代码如下:

FileInputStream is= new FIleInputStream("C:\\Testing\\HELLO.DOC");
WordProcessingMLPackage ml= WordProcessingMLPackage.load(is);

请告诉我如何继续。

1 个答案:

答案 0 :(得分:1)

正如错误所示,docx4j抱怨.doc格式(基于二进制,旧),而不是.docx(更新格式,基于XML)。

Doc4xj无法打开.doc个文件,只能打开XML .docx

仅使用.docx文件。此文件格式自Office 2007以来就存在,并且是默认格式。不要使用较旧的。

要将旧.doc转换为.docx ,请将它们加载到MS Office版本并使用Save as...并选择.docx格式,或使用现有的.doc to .docx converterraise(SIGTRAP)在互联网上,例如:https://document.online-convert.com/convert-to-docx