将docx转换为xml

时间:2011-12-14 17:48:41

标签: xml openxml office-2007

我有一个Microsoft Office 2007(docx)word文档。我想将其转换为结构化XML格式。这样我就可以根据xml元素和属性名称轻松读取数据并将其放入数据库中。

我怎样才能轻松实现?如果我可以将单词转换为打开xml格式,我怎样才能读取open xml,因为获取打开的xml格式数据并不容易。

2 个答案:

答案 0 :(得分:1)

您可以通过-

轻松地将docx文件转换为xml。

1-打开终端

2- cd到单词文档的位置

cd path/to/your/file.docx

3-运行命令

unzip file.docx -d folder-name

答案 1 :(得分:0)

docx由多个xml文件组成。您必须以自己的方式将组件拆解并重组为单个docx。可以创建代表docx结构的数据库结构。除非您需要以编程方式访问和修改word文档,否则我会说不建议直接复制结构。创建适合您应用程序的解决方案更有意义。如果您只想存储docx文件,请考虑直接存储它们而不是反汇编它们。