应用错误收集

我正在尝试使用Apache Tika™从PDF文档中提取以下信息

对于上面的列表，我可以想象它唯一的＆＃34; 3）。＆＃34;我将需要雇用＆＃34;其他＆＃34;从我所看到的内容中获取所有文档ID的资源不能依赖于包含所有相关标识的PDF文档。

对于所有其他内容，它必须是可用的＆＃34;不知何故＆＃34;通过使用Tika内置功能或开发一组自定义处理程序和/或解析器。

是否有可能采用Apache Tike＆＃34;开箱即用＆＃34;提取所需信息？