如何使用apache tika阅读pdf书签?

时间:2015-04-15 10:48:58

标签: java apache-tika

我正在使用apache tika库来阅读pdf内容。剂量相同的库允许阅读pdf书签吗?

1 个答案:

答案 0 :(得分:2)

  

同一个库是否也允许阅读pdf书签?

我认为答案是肯定的。

  • 我发现Tika错误报告(已修复)有关从PDF书签中提取文字无效。

  • Tika使用Apache PDFBox库来阅读PDF文件,该图书馆的网站说它处理PDF书签。

而且......

  • " PDF:现在提取书签中的文字(TIKA-1035)。" 来自Tika 1.3发行说明。