我正在使用POI 3.11并排读取两个Excel文件来比较它们。
当我循环浏览两个文件以查找每个工作表的行数/列数时,POI声明其中一个工作表没有行,但如果我打开其中一个文件,并在一个工作表上进行一次编辑,再次通过POI运行,然后数字不同。
我写了一个小程序,在我做出改变之前和之后计算单个文件中的行,这是输出:
FileName: clean.xls
Sheet name: [One]
[One] row count: 1
Sheet name: [Two]
[Two] row count: 2
FileName: modified.xls
Sheet name: [One]
[One] row count: 3499
Sheet name: [Two]
[Two] row count: 10
请记住,我所做的更改只是表单One
,但两张表的行计数似乎都在更新。重要的是,文件的两个版本分别有3499和10行。
这是代码的缩减版本:
package com.jpmc.firmrisk.tools.excel;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import org.apache.log4j.Logger;
import org.apache.poi.ss.usermodel.Row;
import org.apache.poi.xssf.usermodel.XSSFSheet;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;
public class ExcelFileParser {
private static final Logger LOG = Logger.getLogger(ExcelFileParser.class);
public static void main(String[] args) {
String[] fileNames = new String[] {
"clean.xls",
"modified.xls"
};
for (String fileName: fileNames) {
try {
LOG.info("FileName: " + fileName);
FileInputStream file = new FileInputStream(new File(fileName));
XSSFWorkbook workbook = new XSSFWorkbook(file);
for (int i = 0; i < workbook.getNumberOfSheets(); i++) {
XSSFSheet sheet = workbook.getSheetAt(i);
String sheetName = sheet.getSheetName();
LOG.info(" Sheet name: " + sheetName);
int rowCount = 0;
for (Row ignored: sheet) {
rowCount++;
}
LOG.info(" " + sheetName + " row count: " + rowCount);
}
file.close();
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (IOException ae) {
ae.printStackTrace();
}
}
}
}
我没有使用迭代器,而是尝试使用Sheet.getFirstRowNum()
,Sheet.getLastRowNum()
和Sheet.getPhysicalNumberOfRows()
方法,但所有方法都声称干净电子表格的工作表上没有数据。< / p>
有没有人见过这个?它有解决方法吗?或者这是Excel文件的已知问题吗?
答案 0 :(得分:1)
事实证明原始工作表是使用SpreadSheet Gears(显然是AC#库)而不是Excel创建的,我猜测POI和SSG对Excel保存文件的结构做出了不同的假设,这就是问题源于。