PDF到XML转换

时间:2014-02-20 05:37:35

标签: java xml pdf adobe enterprise

我们正在寻找可以将PDF文档转换为XML数据的企业解决方案。

我对任何解决方案都没问题;

  1. 如果有来自主要软件提供商的现成产品。
  2. 我们可以使用Java框架吗?
  3. 是否有adobe提供的API?

1 个答案:

答案 0 :(得分:0)

您可以使用Apache Tika读取pdf文档内容,然后以某种方式将其转换为XML。也许创建一个Apache Camel路由,读取文件夹中的文档,然后使用Tika提取内容,然后将其作为XML吐出来。