有人可以解释Word 2003和2007年的xml结构差异吗?干杯! :)
答案 0 :(得分:3)
这是一个非常广泛的问题,因此很难知道您正在寻找什么样的解释,但主要观点可以说是:
一个。 Word 2003 XML文件是真正的未压缩XML格式文件,可以保存到单个未压缩的文本文件中。 Word 2007可以保存为该格式,但其本机格式是存储在.zip文件中的XML和其他文件(例如,图像文件)的捆绑。主文档正文,页眉/页脚,脚注,样式,文档属性等都有单独的XML文件。但是,Word 2007还可以保存为自己的单个,未压缩的XML文件格式,通常称为“Flat OPC”。
湾Word 2003格式中使用的主要命名空间URI为http://schemas.microsoft.com/office/word/2003/wordml
主文档的Word 2007格式中使用的主命名空间URI是 http://schemas.openxmlformats.org/wordprocessingml/2006/main
使用了其他几个名称空间URI,但是对于Word 2007,如果您想为ZIP中包含的每种类型的xml文档使用不同的主名称空间。
℃。 Word 2003格式不是AFAIK在Microsoft之外标准化的。 Word 2007格式是两个标准ECMA-376和ISO 29500的基础。2007年的AFAICR符合ECMA-376,或几乎符合它。只有.zip压缩格式才是标准。 Flat OPC格式不是,AFAIK所使用的附加XML命名空间从未正式记录(并不难以理解)。
由于OOXML格式将Word文档拆分为多个单独的XML文档和其他组件(通常称为“部件”),因此该格式还使用了“关系”文件,其中包含定义一个部件和一个部件之间关系的XML。另一个。例如,如果主文档包含图片,则主文档的XML可能需要引用图像文件部分,但通常使用关系ID而不是直接命名部件。