标签: c# pdf ms-word openxml-sdk text-extraction
我想构建一个从pdf或word文件中读取和提取信息的应用程序。 例如,我有一个pdf格式或word格式的文件,我想提取联系人,地址,电子邮件等信息。我怎么能用c#来做?
答案 0 :(得分:1)
对于Word,只需查看Open XML SDK和Power Tools for Open XML即可。它们使您可以非常顺利地使用任何Open XML文件。 对于PDF,只需查看iTextSharp,这是一个非常棒的.Net文库。