如何使用apache POI事件API获取合并区域?

时间:2012-07-23 08:08:16

标签: java apache-poi

如何使用Apache POI提供的事件API获取Excel工作表的合并区域(合并单元格)?

使用“传统”类DOM解析样式,有一些名为Sheet.getNumMergedRegions()Sheet.getMergedRegion(int)的方法。不幸的是,我需要处理巨大的Excel文件,即使我允许使用最高的Xmx值(在这个项目中),我也会出现内存错误。所以我想使用事件API,但是无法找到如何获取有关合并区域的信息,我需要知道这些信息才能正确“理解”内容......

使用此处给出的示例: http://poi.apache.org/spreadsheet/how-to.html#xssf_sax_api 我为合并区域的每个单元格获取事件(但只有第一个单元格包含任何文本内容)。所以,也许,如果没有更直接的方式,那将有助于了解这些合并的细胞如何(安全地)与其他(空)细胞区分开来......

3 个答案:

答案 0 :(得分:2)

我不确定合并的单元格信息存储在哪里,但我很确定它不会与单元格数据本身有关,因为这不是Excel方式。

我建议你做的是创建一个没有合并单元格的简单文件。然后,复制一份,并添加一个合并的单元格。解压这两个(.xlsx是xml文件的zip文件),然后区分它们。这将很快向您展示将单元格标记为合并的设置。 (我的预感是,它将在工作表设置中的某个位置,靠近开始但不接近单元格值,BICBW)

一旦您知道合并的单元格详细信息的位置,您就可以查看XSSF UserModel代码,以便使用合并的单元格来了解它们的工作方式,它们的操作方式,选项的内容等。考虑到这一点,您可以查看文件格式文档以获取完整的详细信息,但这些文档可能会有点沉重且详细。最后,您可以添加代码以使用合并的信息详细信息,一旦您知道从哪里获取它!

答案 1 :(得分:1)

您需要打开流并解析它两次。

第一次 - 提取合并的单元格。它们显示在sheet...xml标记之后的<sheetData>...</sheetData>文件中,如下例所示:

...
< /sheetData >
< mergeCells count="2" >
    < mergeCell ref="A2:C2"/ >
    < mergeCell ref="A3:A7"/ >
 </mergeCells >

提取并保留在某个列表中。

然后再次重新打开流并像往常一样解析它,以提取行和单元格。在完成每一行的endElement(...)方法中,检查该行是否(部分或完全)出现在合并区域中。

答案 2 :(得分:1)

扩展迈克的答案。您可以创建ContentHandler来定位合并区域,如:

import java.util.ArrayList;
import java.util.List;

import org.apache.poi.ss.util.CellRangeAddress;

import org.xml.sax.Attributes;
import org.xml.sax.helpers.DefaultHandler;

public class MergedRegionLocator extends DefaultHandler {
    private final List<CellRangeAddress> mergedRegions = new ArrayList<>();

    @Override
    public void startElement (String uri, String localName, String name, Attributes attributes) {
        if ("mergeCell".equals(name) && attributes.getValue("ref") != null) {
            mergedRegions.add(CellRangeAddress.valueOf(attributes.getValue("ref")));
        }
    }

    public CellRangeAddress getMergedRegion (int index) {
        return mergedRegions.get(index);
    }

    public List<CellRangeAddress> getMergedRegions () {
        return mergedRegions;
    }
}

将其与POI基于事件的解析一起使用的示例:

OPCPackage pkg = OPCPackage.open(new FileInputStream("test.xlsx"));
XSSFReader reader = new XSSFReader(pkg);
InputStream sheetData = reader.getSheetsData().next();

MergedRegionLocator mergedRegionLocator = new MergedRegionLocator();
XMLReader parser = XMLReaderFactory.createXMLReader();
parser.setContentHandler(mergedRegionLocator);
parser.parse(new InputSource(sheetData));

mergedRegionLocator.getMergedRegions();