Apache Tika输出格式

时间:2017-01-02 13:46:08

标签: java pdfbox apache-tika

我有一个要求,其中pdf文件作为输入,我必须阅读它并基于一些规则,我必须拆分pdf的每一页。规则将基于将从给定的pdf中提取的数据来驱动。

我认为,我使用了Apache Tika Toolkit,它假设是为这样的要求而构建的。使用此工具以文本格式提取数据。我希望输出以pdf格式返回。我不确定是否可能。请建议。

感谢。 和Manish。

0 个答案:

没有答案