标签: .net pdf parsing title ifilter
我想解析pdf文件,以便我可以识别每篇文章的标题及其描述。因此我可以将标题文本和描述文本存储在缓存中以供搜索目的。是否有任何库或工具?
答案 0 :(得分:1)
首先,您可以安装Adobe Pdf IFilter dll。然后,您可以使用this library(在C#中使用IFilter)从任何.pdf文件中读取属性。或者您也可以查看this library(使用IFilter实现TextReader以提取各种文件内容)。