寻找pdf目录转换为html的建议

时间:2011-12-16 23:10:29

标签: html pdf

我有一个客户,它是齿轮和链条的生产者,他们有一个200页的目录,主要包括文本,带数字的表格和许多图表。我必须将内容(保持格式)传输到新网站,我已经开始一次传输数据1页的过程。以下是我正在处理的内容类型的示例:

enter image description here

关于如何自动进行此类转化的任何想法?

2 个答案:

答案 0 :(得分:0)

<强> pdftocairo

是一个转换实用程序,能够将pdf内容 转换为 ,保持完全布局,以及多种格式,其中一种是 svg

svg 可以在网页上使用,在html页面中,mozilla浏览器有一个嵌入式svg查看器(资源管理器需要免费插件Adobe svg查看器)

它可能是最好的解决方案,但我们需要看一下单个svg产生的大小

转换 svg 中的pdf的所有页面(完全看作pdf页面)首先需要在专用目录中的单页中破解你的pdf(然后你移动你的来源pdf一个目录了)

pdftk yourfile.pdf burst && move yourfile.pdf ..

然后递归使用 pdftocairo

for f in *.pdf; do pdftocairo -svg $f; done

如果生成的svg的大小不是太大,可以在网站上使用,否则你需要使用

<强> pdftohtml

希望布局保持不变

答案 1 :(得分:0)

我们在http://www.jpedal.org/html_index.php有一个PDF2HTML5工具,可能会满足您的需求。