标签: java pdfbox pdfclown
我搜索一个免费的Java库来分析商业程序中的pdf。
通过计算不同的单词并检测标题,在pdf中进行数据挖掘的哪个库是更好的?
答案 0 :(得分:6)
PDFBox将成为一个优秀的PDF库Java库。目前,最新版本还不稳定,提供了很好的解决方案。文档很可爱,所以如果你想做简单的事情,你就不会浪费太多时间学习。