标签: java xml pdf adobe enterprise
我们正在寻找可以将PDF文档转换为XML数据的企业解决方案。
我对任何解决方案都没问题;
答案 0 :(得分:0)
您可以使用Apache Tika读取pdf文档内容,然后以某种方式将其转换为XML。也许创建一个Apache Camel路由,读取文件夹中的文档,然后使用Tika提取内容,然后将其作为XML吐出来。