我需要解析xlsx文件中的数据。目前我正在使用Jakarta-POI(v.3.11)来做到这一点。它处理好一些xlsx,但不是全部。我注意到未正确解析的文件是"严格的xlsx"使用Office 2013保存的文件。更确切地说,此文件符合ISO29500而非ECMA-376,不同之处在于ISO29500文件中存在与类型的关系:
http://purl.oclc.org/ooxml/officeDocument/relationships/officeDocument
和Jakarta-POI正在寻找:
String CORE_DOCUMENT = " http://schemas.openxmlformats.org/officeDocument/2006/relationships/officeDocument"
有没有办法让Jakarta-POI读取这些文件?
答案 0 :(得分:2)
OOXML Strict Converter for Office 2010可能会有所帮助。
http://pyxb.sourceforge.net/PyXB-1.2.2/bundles.html上列出了一些purl名称空间(上面的Jethro链接似乎不再有用)。
可以在以下位置找到最新的XML架构文件: http://www.ecma-international.org/publications/standards/Ecma-376.htm