dot net:我需要解析pdf文件以获得每篇文章的标题?

时间:2009-06-29 13:13:39

标签: .net pdf parsing title ifilter

我想解析pdf文件,以便我可以识别每篇文章的标题及其描述。因此我可以将标题文本和描述文本存储在缓存中以供搜索目的。是否有任何库或工具?

1 个答案:

答案 0 :(得分:1)

首先,您可以安装Adobe Pdf IFilter dll。然后,您可以使用this library(在C#中使用IFilter)从任何.pdf文件中读取属性。或者您也可以查看this library(使用IFilter实现TextReader以提取各种文件内容)。