我想知道是否有人对使用 Apache POI
处理损坏的文件有任何建议我正在尝试打开文件并收到此消息:
Exception in thread "main" org.apache.poi.hssf.record.RecordInputStream$LeftoverDataException: Initialisation of record 0x1C left 2 bytes remaining still to be read.
at org.apache.poi.hssf.record.RecordInputStream.hasNextRecord(RecordInputStream.java:156)
at org.apache.poi.hssf.record.RecordFactoryInputStream.nextRecord(RecordFactoryInputStream.java:231)
at org.apache.poi.hssf.record.RecordFactory.createRecords(RecordFactory.java:480)
at org.apache.poi.hssf.usermodel.HSSFWorkbook.<init>(HSSFWorkbook.java:301)
at org.apache.poi.ss.usermodel.WorkbookFactory.create(WorkbookFactory.java:95)
at ExcelImporter.EditFileImportDialog.main(EditFileImportDialog.java:409)
这是SSCCE
import org.apache.poi.openxml4j.exceptions.InvalidFormatException;
import org.apache.poi.ss.usermodel.Workbook;
import org.apache.poi.ss.usermodel.WorkbookFactory;
public class EditFileImportDialog {
/* Omitted irrelevent code */
public static void main(String[] args) {
File file = new File("Z:\\Path\\To\\File_causing_the_trouble.xls");
try {
Workbook wb = WorkbookFactory.create(file); // Line 409 for ref to the exception stack trace
System.out.println(wb);
} catch (InvalidFormatException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}
}
仅在此文件中发生这种情况,如果我在excel中打开文件并保存它,然后尝试使用POI
打开它,则不会抛出异常。关于如何处理这个问题的任何建议?
修改
请注意,我的问题可能与this question有关,但升级POI
并未解决我的问题,并且与所描述的文件存在差异。我一直在寻找类似的答案,但也许如果有人知道excel文件本身有什么问题,我可以写一些东西来修补文件。
编辑2
文件创建不在我的控制范围内。 Excel在打开并重新保存文件时自行修复文件。我的问题是,是否有人能想出一种调整/增强POI来处理这个受损文件的方法,就像excel能够解决问题一样。
编辑3
回应几条评论/答案:
我的最终目标是根本不使用excel。
答案 0 :(得分:1)
您可以尝试使用HSSFWorkbook打开.xls文件。
您可以使用以下代码检查POI如何响应确定xls格式。
private boolean isExcel(InputStream i) throws IOException {
return (POIFSFileSystem.hasPOIFSHeader(i) || POIXMLDocument.hasOOXMLHeader(i));
}
我会用:
InputStream input = new FileInputStream(fileName);
而不是:
File file = new File("Z:\\Path\\To\\File_causing_the_trouble.xls");
您是否检查过文件中的单元格0x1C有什么问题?
答案 1 :(得分:1)
主线程中的异常不是编码问题。您应该在Excel-Workbook中替换错误的单元格引用!
线程“main”中的异常org.apache.poi.hssf.record.RecordInputStream $ LeftoverDataException: 记录0x23的初始化还剩下12个字节仍待读取。
当我尝试使用POI HSSF打开包含DDE单元格引用的Excel工作簿时,抛出此异常。我有一个单元格引用类型为'Excel.Type.12'的问题,例如: = Excel.Sheet.12 |! '\服务器\路径名\ Workbook.xlsx' '!SHEETNAME Z23S22'
解决方法:将引用替换为“Sheet”类型的引用,例如: = '驱动器:\路径名[Workbook.xlsx] SHEETNAME'!$ V $ 23
保存您的工作簿并再试一次。
答案 2 :(得分:0)
尝试从FileInputStream创建XSSFWorkbook。
根据更改,您的样本将如下所示:
import org.apache.poi.openxml4j.exceptions.InvalidFormatException;
import org.apache.poi.ss.usermodel.Workbook;
import org.apache.poi.ss.usermodel.WorkbookFactory;
public class EditFileImportDialog {
/* Omitted irrelevent code */
public static void main(String[] args) {
String file = "Z:\\Path\\To\\File_causing_the_trouble.xls";
try {
InputStream databaseFile = new FileInputStream(file);
XSSFWorkbook wb = new XSSFWorkbook(databaseFile);
System.out.println(wb);
} catch (InvalidFormatException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}
}
答案 3 :(得分:0)
您可能已经检查过,但如果没有,请参阅https://bz.apache.org/bugzilla/show_bug.cgi?id=47251是否有帮助。它有类似的问题,你可以找到如何处理它的答案。