我怎么读.docx文件?

时间:2010-09-03 06:56:27

标签: c# docx

我有一个.docx文件,它包含许多我要批量发送邮件的电子邮件地址。我如何通过c#读取docx文件?

7 个答案:

答案 0 :(得分:12)

最简单的方法可能是使用Open XML SDK 2.0

获取Code Snippets for Visual Studio 2008以获取一些示例

我强烈建议下载Open XML SDK生产力工具,它将帮助您了解Open XML文件的结构,甚至可以帮助您根据文档结构生成与SDK一起使用的源代码。您可以从SDK的同一页面下载该工具。这是100MB,但值得下载。

答案 1 :(得分:8)

您可以简单地使用Docx库,它非常好且易于使用。

有关如何使用的示例以及许多示例和视频,请查看他们的GitHub页面。要下载,您可以download from here

答案 2 :(得分:6)

您也可以通过Openop读取Microsoft Office文件,也可以通过Open XML读取Office> 2007文件:

答案 3 :(得分:5)

是的,我知道这是一篇非常古老的帖子,但这些信息可能有助于其他正在搜索论坛的人。

使用Sourceforge的this库。 添加对该库的引用,然后:

Code7248.word_reader.TextExtractor extractor = new TextExtractor(filePath);

string contents = extractor.ExtractText();

答案 4 :(得分:3)

Office 2007及更高版本遵循OpenXML格式。您需要打包API来打开和阅读文档部分

http://msdn.microsoft.com/en-us/library/system.io.packaging.aspx

http://openxmldeveloper.org

答案 5 :(得分:3)

docx文件实际上是档案。

您可以将它们解压缩到复合XML文件中,并通过相关的XML文件(file.docx \ word \ document.xml)读取)并提取电子邮件地址。

此库可帮助您解压缩存档:.Net Zip Library

答案 6 :(得分:2)

有免费的方式来阅读doc& docx文件,它可以帮到你。

Document doc = new Document();
doc.LoadFromFile("yourfile.docx");

http://freeword.codeplex.com/