标签: java pdfbox apache-tika
我有一个要求,其中pdf文件作为输入,我必须阅读它并基于一些规则,我必须拆分pdf的每一页。规则将基于将从给定的pdf中提取的数据来驱动。
我认为,我使用了Apache Tika Toolkit,它假设是为这样的要求而构建的。使用此工具以文本格式提取数据。我希望输出以pdf格式返回。我不确定是否可能。请建议。
感谢。 和Manish。