使用c#从pdf或word文件中读取和提取信息

时间:2015-08-04 06:42:10

标签: c# pdf ms-word openxml-sdk text-extraction

我想构建一个从pdf或word文件中读取和提取信息的应用程序。 例如,我有一个pdf格式或word格式的文件,我想提取联系人,地址,电子邮件等信息。我怎么能用c#来做?

1 个答案:

答案 0 :(得分:1)

对于Word,只需查看Open XML SDKPower Tools for Open XML即可。它们使您可以非常顺利地使用任何Open XML文件。 对于PDF,只需查看iTextSharp,这是一个非常棒的.Net文库。