我有一个.docx文件,它包含许多我要批量发送邮件的电子邮件地址。我如何通过c#读取docx文件?
答案 0 :(得分:12)
最简单的方法可能是使用Open XML SDK 2.0
获取Code Snippets for Visual Studio 2008以获取一些示例
我强烈建议下载Open XML SDK生产力工具,它将帮助您了解Open XML文件的结构,甚至可以帮助您根据文档结构生成与SDK一起使用的源代码。您可以从SDK的同一页面下载该工具。这是100MB,但值得下载。
答案 1 :(得分:8)
您可以简单地使用Docx库,它非常好且易于使用。
有关如何使用的示例以及许多示例和视频,请查看他们的GitHub页面。要下载,您可以download from here
答案 2 :(得分:6)
您也可以通过Openop读取Microsoft Office文件,也可以通过Open XML读取Office> 2007文件:
答案 3 :(得分:5)
是的,我知道这是一篇非常古老的帖子,但这些信息可能有助于其他正在搜索论坛的人。
使用Sourceforge的this库。 添加对该库的引用,然后:
Code7248.word_reader.TextExtractor extractor = new TextExtractor(filePath);
string contents = extractor.ExtractText();
答案 4 :(得分:3)
Office 2007及更高版本遵循OpenXML格式。您需要打包API来打开和阅读文档部分
http://msdn.microsoft.com/en-us/library/system.io.packaging.aspx
答案 5 :(得分:3)
docx文件实际上是档案。
您可以将它们解压缩到复合XML文件中,并通过相关的XML文件(file.docx \ word \ document.xml)读取)并提取电子邮件地址。
此库可帮助您解压缩存档:.Net Zip Library
答案 6 :(得分:2)
有免费的方式来阅读doc& docx文件,它可以帮到你。
Document doc = new Document();
doc.LoadFromFile("yourfile.docx");