如何将pdf文件转换为html文件?

时间:2009-09-12 08:05:06

标签: pdf-to-html

应保持格式,看起来与原始格式几乎相同。

1 个答案:

答案 0 :(得分:1)

几个例子:

This page讨论如何使用名为 pdftohtml 的软件在Ubuntu中进行转换。

This page列出了将PDF转换为各种MS格式的共享软件(可能是Windows),包括 htm

我甚至发现了几个视频(Google视频和www.break.com上的视频)。我没有看他们,因为我认为他们只会描述如何使用某些软件。

如果你想知道如何自己做这些,这些显然是不能令人满意的。

我认为PDF最初是一个压缩的'postscript'文件,但现在可能包含图像(例如扫描文档)。

如果是这种情况,请不要费心寻找文字,您可以提取图像并创建HTML页面来显示图像。这至少应该使您能够保留格式。

至少,您可以屏幕捕获PDF页面以创建图像。我知道原油,但无论PDF是后记还是图像都可以。