如何在Java中解析严格的* .xlsx文件

时间:2015-03-13 01:49:16

标签: apache-poi openxml import-from-excel

我需要解析xlsx文件中的数据。目前我正在使用Jakarta-POI(v.3.11)来做到这一点。它处理好一些xlsx,但不是全部。我注意到未正确解析的文件是"严格的xlsx"使用Office 2013保存的文件。更确切地说,此文件符合ISO29500而非ECMA-376,不同之处在于ISO29500文件中存在与类型的关系:

  

http://purl.oclc.org/ooxml/officeDocument/relationships/officeDocument

和Jakarta-POI正在寻找:

  

String CORE_DOCUMENT =   " http://schemas.openxmlformats.org/officeDocument/2006/relationships/officeDocument"

有没有办法让Jakarta-POI读取这些文件?

1 个答案:

答案 0 :(得分:2)

如果您需要使用旧格式重新保存文档,

OOXML Strict Converter for Office 2010可能会有所帮助。

http://pyxb.sourceforge.net/PyXB-1.2.2/bundles.html上列出了一些purl名称空间(上面的Jethro链接似乎不再有用)。

可以在以下位置找到最新的XML架构文件: http://www.ecma-international.org/publications/standards/Ecma-376.htm