在没有Word的.net中读取.doc,.docx,.pdf,.rtf文档

时间:2012-03-10 05:03:46

标签: c# .net pdf docx .doc

到目前为止,它只是一般的词,但价格非常昂贵

其他是转换为.pdf或打印到.pdf

我正在寻找一种方法来阅读这些doc类型的内容,而无需安装office或pdf应用程序 即获取这些文档的文本以进行解析

2 个答案:

答案 0 :(得分:0)

您希望使用插入IFilter框架的组件,这是Windows用于索引文档以进行文本搜索的内容。

对于办公文档,您可以使用Office 2010 Filter Pack 对于pdf,您可以使用商业产品,例如FoxIt IFilter,这看起来价格合理。

答案 1 :(得分:0)

DevExpress现在提供了一个文档服务器组件,其价格远低于Aspose。