场景:
1)使用SXSSFWorkbook将csv文件转换为excel文件。
2)如果再次使用XSSFWorkbook从CSV文件读取数据并将其写入上述生成的excel文件,则字符串数据在libre office中不可见,但如果在在线excel查看器中打开excel文件,则数据可见观众提到文件已损坏,数据可以恢复。
使用SXSSFWorkbook创建单元格:
单元格单元格= row.createCell(1);
cell.setCellValue(“ Some Value”);
使用XSSFWorkbook进行单元更新:
单元格单元格= row.getCell(1);
cell.setCellValue(“ Some Value”);
观察:
1)使用XSSFCell更新单元格值时,单元格的原始值和单元格的字符串值是不同的。
2)如果使用SXSSFWorkbook生成excel文件并使用XSSFWorkbook打开,则内部维护的STCellType为STCellType.INLINE_STR;如果使用XSSFWorkbook生成excel文件,则内部维护的STCellType为STCellType.S(在XSSFCell的CTCell中使用STCellType)。
Apache POI版本:4.1.0
请提出解决方案。
答案 0 :(得分:0)
SXSSFWorkbook
默认使用内联字符串,而XSSFWorkbook
默认使用共享字符串表。并且XSSFCell.setCellValueImpl对于内联字符串不完整。它确实:
...
if(_cell.getT() == STCellType.INLINE_STR) {
//set the 'pre-evaluated result
_cell.setV(str.getString());
}
...
因此对于内联字符串,它总是设置包含文本的v
元素。但是内联字符串也可能具有is
元素,其中t
元素包含文本,甚至is
元素也具有不同的富文本行。不考虑使用XSSFCell
。
但是SXSSFWorkbook可以被构造,因此它也使用共享字符串表。请参见构造函数SXSSFWorkbook(XSSFWorkbook workbook, int rowAccessWindowSize, boolean compressTmpFiles, boolean useSharedStringsTable)
。因此,如果使用以下构造函数:
SXSSFWorkbook sxssfWorkbook = new SXSSFWorkbook(new XSSFWorkbook(), 2, true, true);
然后不使用任何内联字符串,以后使用XSSF
进行更新也不会出现问题。
如果SXSSFWorkbook
不是使用共享字符串表而是内联字符串,则以后使用XSSF
更新单元格时会出现问题,因为XSSFCell
使用内联字符串不完整。可能的解决方法是使用自己的代码管理内联字符串更新。
示例:
import java.io.FileOutputStream;
import java.io.FileInputStream;
import org.apache.poi.ss.usermodel.WorkbookFactory;
import org.apache.poi.xssf.usermodel.*;
import org.apache.poi.xssf.streaming.*;
import org.openxmlformats.schemas.spreadsheetml.x2006.main.STCellType;
public class SXSSFTest {
public static void main(String[] args) throws Exception {
// first create SXSSFTest.xlsx using SXSSF ============================================
String[][] data1 = new String[][]{
new String[]{"A1", "B1", "C1"},
new String[]{"A2", "B2", "C2"},
new String[]{"A3", "B3", "C3"},
new String[]{"A4", "B4", "C4"}
};
SXSSFWorkbook sxssfWorkbook = new SXSSFWorkbook();
//SXSSFWorkbook sxssfWorkbook = new SXSSFWorkbook(new XSSFWorkbook(), 2, true, true);
SXSSFSheet sxssfSheet = sxssfWorkbook.createSheet();
int r = 0;
for (String[] rowValues : data1) {
SXSSFRow row = sxssfSheet.createRow(r++);
int c = 0;
for (String value : rowValues) {
SXSSFCell cell = row.createCell(c++);
cell.setCellValue(value);
}
}
FileOutputStream outputStream = new FileOutputStream("SXSSFTest.xlsx");
sxssfWorkbook.write(outputStream);
outputStream.close();
sxssfWorkbook.dispose();
sxssfWorkbook.close();
// now reread the SXSSFTest.xlsx and update it using XSSF =============================
String[][] data2 = new String[][]{
new String[]{"A2 New", "B2 New", "C2 New"},
new String[]{"A3 New", "B3 New", "C3 New"}
};
XSSFWorkbook xssfWorkbook = (XSSFWorkbook)WorkbookFactory.create(
new FileInputStream("SXSSFTest.xlsx"));
XSSFSheet xssfSheet = xssfWorkbook.getSheetAt(0);
r = 1;
for (String[] rowValues : data2) {
XSSFRow row = xssfSheet.getRow(r++); if (row == null) row = xssfSheet.createRow(r++);
int c = 0;
for (String value : rowValues) {
XSSFCell cell = row.getCell(c++);
if (cell != null) { // cell was already there
if (cell.getCTCell().getT() == STCellType.INLINE_STR) { // cell has inline string in it
if (cell.getCTCell().isSetIs()) { // inline string has is element
cell.getCTCell().getIs().setT(value); // set t element in is element
} else {
cell.getCTCell().setV(value); // set v element of inline string
}
} else {
cell.setCellValue(value); // set shared string cell value
}
} else {
cell = row.createCell(c++);
cell.setCellValue(value);
}
}
}
outputStream = new FileOutputStream("XSSFTest.xlsx");
xssfWorkbook.write(outputStream);
outputStream.close();
xssfWorkbook.close();
}
}
之后,SXSSFTest.xlsx
在我的LibreOffice Calc
中是这样的:
所有单元格中都有内联字符串。
XSSFTest.xlsx
看起来像这样:
现在所有内联字符串都已正确更新。
LibreOffice
Version: 6.0.7.3
Build ID: 1:6.0.7-0ubuntu0.18.04.5