使用SXSSFWorkbook创建Excel并使用XSSFWorkbook修改excel时,字符串单元格数据在excel编辑器中不可见

时间:2019-05-29 10:12:41

标签: java apache-poi libreoffice

场景:
1)使用SXSSFWorkbook将csv文件转换为excel文件。 2)如果再次使用XSSFWorkbook从CSV文件读取数据并将其写入上述生成的excel文件,则字符串数据在libre office中不可见,但如果在在线excel查看器中打开excel文件,则数据可见观众提到文件已损坏,数据可以恢复。

使用SXSSFWorkbook创建单元格:
单元格单元格= row.createCell(1);
cell.setCellValue(“ Some Value”);

使用XSSFWorkbook进行单元更新:
单元格单元格= row.getCell(1);
cell.setCellValue(“ Some Value”);

观察
1)使用XSSFCell更新单元格值时,单元格的原始值和单元格的字符串值是不同的。

2)如果使用SXSSFWorkbook生成excel文件并使用XSSFWorkbook打开,则内部维护的STCellType为STCellType.INLINE_STR;如果使用XSSFWorkbook生成excel文件,则内部维护的STCellType为STCellType.S(在XSSFCell的CTCell中使用STCellType)。

Apache POI版本:4.1.0

请提出解决方案。

1 个答案:

答案 0 :(得分:0)

SXSSFWorkbook默认使用内联字符串,而XSSFWorkbook默认使用共享字符串表。并且XSSFCell.setCellValueImpl对于内联字符串不完整。它确实:

...
if(_cell.getT() == STCellType.INLINE_STR) {
 //set the 'pre-evaluated result
 _cell.setV(str.getString());
}
...

因此对于内联字符串,它总是设置包含文本的v元素。但是内联字符串也可能具有is元素,其中t元素包含文本,甚至is元素也具有不同的富文本行。不考虑使用XSSFCell

但是SXSSFWorkbook可以被构造,因此它也使用共享字符串表。请参见构造函数SXSSFWorkbook(XSSFWorkbook workbook, int rowAccessWindowSize, boolean compressTmpFiles, boolean useSharedStringsTable)。因此,如果使用以下构造函数:

SXSSFWorkbook sxssfWorkbook = new SXSSFWorkbook(new XSSFWorkbook(), 2, true, true);

然后不使用任何内联字符串,以后使用XSSF进行更新也不会出现问题。


如果SXSSFWorkbook不是使用共享字符串表而是内联字符串,则以后使用XSSF更新单元格时会出现问题,因为XSSFCell使用内联字符串不完整。可能的解决方法是使用自己的代码管理内联字符串更新。

示例:

import java.io.FileOutputStream;
import java.io.FileInputStream;

import org.apache.poi.ss.usermodel.WorkbookFactory;
import org.apache.poi.xssf.usermodel.*;
import org.apache.poi.xssf.streaming.*;

import org.openxmlformats.schemas.spreadsheetml.x2006.main.STCellType;

public class SXSSFTest {

 public static void main(String[] args) throws Exception {

  // first create SXSSFTest.xlsx using SXSSF ============================================

  String[][] data1 = new String[][]{
   new String[]{"A1", "B1", "C1"},
   new String[]{"A2", "B2", "C2"},
   new String[]{"A3", "B3", "C3"},
   new String[]{"A4", "B4", "C4"}
  };

  SXSSFWorkbook sxssfWorkbook = new SXSSFWorkbook();
  //SXSSFWorkbook sxssfWorkbook = new SXSSFWorkbook(new XSSFWorkbook(), 2, true, true);

  SXSSFSheet sxssfSheet = sxssfWorkbook.createSheet();

  int r = 0;
  for (String[] rowValues : data1) {
   SXSSFRow row = sxssfSheet.createRow(r++);
   int c = 0;
   for (String value : rowValues) {
    SXSSFCell cell = row.createCell(c++);
    cell.setCellValue(value);
   }
  }

  FileOutputStream outputStream = new FileOutputStream("SXSSFTest.xlsx");
  sxssfWorkbook.write(outputStream);
  outputStream.close();
  sxssfWorkbook.dispose();
  sxssfWorkbook.close();

  // now reread the SXSSFTest.xlsx and update it using XSSF =============================

  String[][] data2 = new String[][]{
   new String[]{"A2 New", "B2 New", "C2 New"},
   new String[]{"A3 New", "B3 New", "C3 New"}
  };

  XSSFWorkbook xssfWorkbook = (XSSFWorkbook)WorkbookFactory.create(
                               new FileInputStream("SXSSFTest.xlsx"));

  XSSFSheet xssfSheet = xssfWorkbook.getSheetAt(0);

  r = 1;
  for (String[] rowValues : data2) {
   XSSFRow row = xssfSheet.getRow(r++); if (row == null) row = xssfSheet.createRow(r++);
   int c = 0;
   for (String value : rowValues) {
    XSSFCell cell = row.getCell(c++); 
    if (cell != null) { // cell was already there
     if (cell.getCTCell().getT() == STCellType.INLINE_STR) { // cell has inline string in it
      if (cell.getCTCell().isSetIs()) { // inline string has is element
       cell.getCTCell().getIs().setT(value); // set t element in is element
      } else {
       cell.getCTCell().setV(value); // set v element of inline string
      }
     } else {
      cell.setCellValue(value); // set shared string cell value
     }
    } else {
     cell = row.createCell(c++);
     cell.setCellValue(value);
    }
   }
  }

  outputStream = new FileOutputStream("XSSFTest.xlsx");
  xssfWorkbook.write(outputStream);
  outputStream.close();   
  xssfWorkbook.close();

 }
}

之后,SXSSFTest.xlsx在我的LibreOffice Calc中是这样的:

enter image description here

所有单元格中都有内联字符串。

XSSFTest.xlsx看起来像这样:

enter image description here

现在所有内联字符串都已正确更新。

LibreOffice
Version: 6.0.7.3
Build ID: 1:6.0.7-0ubuntu0.18.04.5