使用Docx4J.load加载.doc文件时获取This file seems to be a binary doc/ppt/xls
。
我尝试使用docx4j加载.doc,但得到了上述异常。
代码如下:
FileInputStream is= new FIleInputStream("C:\\Testing\\HELLO.DOC");
WordProcessingMLPackage ml= WordProcessingMLPackage.load(is);
请告诉我如何继续。
答案 0 :(得分:1)
正如错误所示,docx4j抱怨.doc
格式(基于二进制,旧),而不是.docx
(更新格式,基于XML)。
Doc4xj无法打开.doc
个文件,只能打开XML .docx
。
仅使用.docx文件。此文件格式自Office 2007以来就存在,并且是默认格式。不要使用较旧的。
要将旧.doc转换为.docx ,请将它们加载到MS Office版本并使用Save as...
并选择.docx格式,或使用现有的.doc to .docx converter
种raise(SIGTRAP)
在互联网上,例如:https://document.online-convert.com/convert-to-docx