我了解到.docx文件基本上是二进制文件。但我并不知道下面的结构。
.docx文件的基本结构是什么?比如,标题有多长?实际文档内容从什么时候开始?最后是否有任何签名?
基本上,.docx文件的解剖结构是什么?
答案 0 :(得分:3)
Docx基本上是一个zip存档,里面有很多xml文件。它是一种开放格式,文档可在线获取。 wikipedia article有一般描述和您需要的链接。
答案 1 :(得分:1)
您的问题是:"什么是DocX文件的剖析?"
请参阅官方OOXML文章," OOXML剖析,"以获取示例DocX目录结构:
http://officeopenxml.com/anatomyofOOXML.php
有关示例DocX XML文档:
http://officeopenxml.com/WPsampleDoc.php
然而,经过仔细研究,并猜测细节有雾之后,我无法制作docx文件。
我选择了这个捷径:在Libre Office中创建一个Docx文件(支持.docx扩展名),以您希望生成的docx文件的格式创建一个通用模板,保存文件作为.docx,复制并保存为.zip。
打开这个.zip目录,你会发现我发现在解释规范方面要比上面的官方链接好得多。