我将如何使用下面的DocumentFormat.OpenXml -details从docx文件中提取数据

时间:2011-12-22 10:46:27

标签: c# xml office-interop openxml-sdk

我有一个通过添加xml架构创建的Docx文件。我给你docx文件的链接。enter image description here

现在我要提取 - To,From,heading,body。 目前我正在使用Library DocumentFormat.OpemXml。 但没有成功。 可以任何人建议我的步骤。

2 个答案:

答案 0 :(得分:1)

我知道这个答案已经很晚了,但经过多年阅读本网站后,我发现自己有能力提供帮助。

正如之前的回答所述,它就像打开zip文件并检查内容一样简单。如果您打算超越阅读一些简单的数据,这种方法可能会受到限制。

如果您还没有,请查看Microsoft的Open XML Productivity Tool。它是作为openxml sdk的一部分安装的。这使得找到你想要的东西变得更容易。

另一个优秀的资源是PowerTools for OpenXML基本上是PowerShell cmdlet的开源集合。这是我见过针对open xml sdk进行编码的最好例子。

-SDR

答案 1 :(得分:0)

您必须浏览DocumentFormat.OpenXml以从docx文件中提取数据。 或者另一种方法是,

首先将docx文件的扩展名转换为.zip。 打开zip文件后,打开文件document.xml。 在此文件中,您将找到所有数据。 现在您只需要在c#中读取xml文件并提取数据。 您使用xmlDocument类并提取数据

我认为它会有用。