将大量的.pdf转换为.html或.doc

时间:2014-12-31 16:26:14

标签: image image-conversion document-conversion

我正在寻找一个代码片段或其他解决方案,能够同时将高容量(数千)的.pdf转换为.html或.doc:

  • 维护标题的层次结构
  • 捕获文档中的图像,将它们上传到图像服务器并创建它的绝对链接,并维护表格格式。

是否存在这样的工具?如果存在,是谁制造的?如果没有,谁是我可以联系的空间中的一些思想领袖?

1 个答案:

答案 0 :(得分:0)

检查 pdftohtml

然后,您可以在其周围添加一些脚本来进行批量转换。

但结果并非如此。