Java pdf clown vs apache pdf box

时间:2015-07-25 23:32:55

标签: java pdfbox pdfclown

我搜索一个免费的Java库来分析商业程序中的pdf。

通过计算不同的单词并检测标题,在pdf中进行数据挖掘的哪个库是更好的?

1 个答案:

答案 0 :(得分:6)

PDFBox将成为一个优秀的PDF库Java库。目前,最新版本还不稳定,提供了很好的解决方案。文档很可爱,所以如果你想做简单的事情,你就不会浪费太多时间学习。