如何访问作者姓名和其他docx元数据

时间:2016-05-09 12:58:11

标签: c# metadata docx

我想使用C#来获取文件的元数据,例如docx。 在下面的屏幕截图中,您可以看到文件的auteur和其他元数据。

Example

如何将此元数据写入控制台?

1 个答案:

答案 0 :(得分:2)

DOCX中的word文件打包为zip文件。元数据位于该zip文件中的XML文件中。 作为非常简单的方式来思考它,这是您需要通过C#以编程方式进行的操作:

  1. 将DOCX文件解压缩到其文件夹结构中。
  2. 打开位于该结构的docProps文件夹中的core.xml文件。
  3. 拉出并存储您要查找的相关XML元素,例如 标题,主题或其他。
  4. 使用Console.WriteLine()编写这些元素。
  5. Image Showing Structure and XML file

    Info on Office Open XML format