标签: xml ms-office sax apache-tika docx4j
我正在研究这个需要从各种文档中提取数据的项目,为此我需要将文档转换为XML,以便稍后我可以使用SAX Parser解析它。那么,我如何获得与ms office文档相当的XML?