将XML生成的Word DOCX反向工程回XML

时间:2019-03-04 18:11:12

标签: xml ms-word openxml docx

我有一个Word文档,最初是使用XML生成的。现在,我想将其反向工程回XML并获取原始XML代码。最好的方法是什么?

1 个答案:

答案 0 :(得分:1)

现代Word文档(DOCX)基于OOXML,由两部分组成:

  • 基于Zip的开放式包装约定(OPC)。您可以重命名 .zip的DOCX文件扩展名,并使用常规的Zip实用程序打开 它。
  • WordprocessingML,它是基于XML的。您可以使用常规XML工具 和解析器进行读写。

以某种方式,您的DOCX文件已经是XML。关于“原始生成”,这是数据来源而不是数据格式的问题。除了有关作者身份,创建日期/时间等的一些元数据之外,没有什么可用于反向工程DOCX文件的操作,它可以带您回到其原始数据来源。