将pdf转换为单页可编辑的html

时间:2013-07-11 06:31:06

标签: javascript html pdf pdf.js pdf-to-html

我一直在尝试将pdf文件转换为一个漂亮的html页面。之后浏览它。 我得到的解决方案有点缺乏我的要求。因为我必须为大约200个pdf文件创建单独的html页面。因为在线转换器可能不是一个领先的解决方案。所以我尝试了以下解决方案以及未满足的要求。

  • embed tag of html5

    +很好地将pdf嵌入到html页面中。

    - HTML页面不可编辑,因为它只是将pdf嵌入到html页面。

  • pdftohtml

    +将pdf转换为单个html页面。

    -看起来不是很好。

  • pdf.js

    +以可读的外观将pdf转换为html页面。

    - HTML页面无法修改。

  • jpdf2html

    +将pdf转换为单个html页面,外观漂亮,html css。

    -它创建了一个大文件夹,用于缩略图和html页面,用于pdf中的单个页面,这对于大量的pdf文件可能是不可行的。

从哪里可以改善输出..

2 个答案:

答案 0 :(得分:2)

FlexPaper有一个名为Elements的桌面发布者模式,可以将pdf转换为可编辑的元素 - 值得一看

http://flexpaper.devaldi.com/download

答案 1 :(得分:1)

使用Imagemagick将PDF转换为HTML 但是ghostscript可以为您提供输出PDF的改进