标签: java pdf apache-tika
我正在尝试使用Apache Tika™从PDF文档中提取以下信息
Apache Tika™
PDF
对于上面的列表,我可以想象它唯一的" 3)。"我将需要雇用"其他"从我所看到的内容中获取所有文档ID的资源不能依赖于包含所有相关标识的PDF文档。
对于所有其他内容,它必须是可用的"不知何故"通过使用Tika内置功能或开发一组自定义处理程序和/或解析器。
是否有可能采用Apache Tike"开箱即用"提取所需信息?