Microsoft Word(OOXML / DOCX)文档格式验证

时间:2018-12-02 14:57:27

标签: xml xsd openxml docx xsd-validation

有人熟悉OOXML模式吗? 我需要建立一个架构,以根据某些规则来验证特定文档的样式,并且找不到某个参考甚至示例。

2 个答案:

答案 0 :(得分:1)

OOXML的引用为Standard ECMA-376 Office Open XML File Formats。注意,规范很复杂;希望在取得任何进展之前,必须对OOXML规范以及XML技术和技术进行大量的阅读/学习。

另请参见:

答案 1 :(得分:0)

Word文档通常只是段落和表格的平坦序列(表格单元格包含段落),尽管​​您可以使用/嵌套内容控件将段落分组,并且还有其他奇特的对象,例如altChunks。

您可能感兴趣的其他内容:

  • sectPr(控制页眉/页脚,页面大小/方向等),因为这表示新的部件/章节

  • 概述级别?

段落样式只是段落上的设置。有了这种结构,schematron可能不会像针对docbook或TEI那样有用。

但是通过XSLT将主要文档部分(word / document.xml)转换为更简单的方法可能是一种好方法。

这完全取决于您的约束条件。