我有一个Microsoft Office 2007(docx)word文档。我想将其转换为结构化XML格式。这样我就可以根据xml元素和属性名称轻松读取数据并将其放入数据库中。
我怎样才能轻松实现?如果我可以将单词转换为打开xml格式,我怎样才能读取open xml,因为获取打开的xml格式数据并不容易。
答案 0 :(得分:1)
您可以通过-
轻松地将docx文件转换为xml。1-打开终端
2- cd到单词文档的位置
cd path/to/your/file.docx
3-运行命令
unzip file.docx -d folder-name
答案 1 :(得分:0)
docx由多个xml文件组成。您必须以自己的方式将组件拆解并重组为单个docx。可以创建代表docx结构的数据库结构。除非您需要以编程方式访问和修改word文档,否则我会说不建议直接复制结构。创建适合您应用程序的解决方案更有意义。如果您只想存储docx文件,请考虑直接存储它们而不是反汇编它们。