在C#中读取DOC和DOCX文件

时间:2014-10-09 17:54:47

标签: c# asp.net ms-word

我正在尝试用C#读取Word文件。我只需要word文档中的文本。

我正在使用NetOffice库。如果机器上安装了Micorsoft Word,则可以正常工作,但如果未安装MS Word,则会抛出异常。

错误:“未找到Word.ApplicationNetOffice prog.NetOffice.COMObject.CreateFromProgId(String progId)中的Word.Application”

我猜这不起作用,因为NetOffice使用Interop来操作word文件。是否有任何开源库可以读取DOC或DOCX文件(或者一个DOC用于DOC,一个用于DOCX)?

1 个答案:

答案 0 :(得分:3)

OpenXML SDK免费提供,支持.docx和其他Office 2007+格式。

Aspose.Words是商业广告,但确实支持.doc文件(以及其他文件)。