.net - dot net：我需要解析pdf文件以获得每篇文章的标题？ - Thinbug

dot net：我需要解析pdf文件以获得每篇文章的标题？

时间：2009-06-29 13:13:39

标签： .net pdf parsing title ifilter

我想解析pdf文件，以便我可以识别每篇文章的标题及其描述。因此我可以将标题文本和描述文本存储在缓存中以供搜索目的。是否有任何库或工具？

1 个答案:

答案 0 :(得分：1)

首先，您可以安装Adobe Pdf IFilter dll。然后，您可以使用this library（在C＃中使用IFilter）从任何.pdf文件中读取属性。或者您也可以查看this library（使用IFilter实现TextReader以提取各种文件内容）。