将pdf转换为矢量图像

时间:2013-06-20 23:08:29

标签: pdf vector-graphics pdf-to-html

我正在尝试在我的网页中使用pdf内容(数学)。我基本上想将pdf转换为某个矢量图像。将pdf转换为swf可以很好地完成这项工作,但由于每个平台都不支持flash,我正试图找到另一种解决方案。

我读过有关svg的内容,但由于这些pdf包含大量数学,我发现转换器的结果真的很丑陋且不正确。

我还考虑过重新输入乳胶,并使用mathjax显示它,在某种程度上这是最好的解决方案,但也非常耗时。

我唯一想要的是将它转换为漂亮的矢量图像,我不想更改内容或其他任何内容。除了转换为swf或重新输入,还有其他解决方案吗?

编辑: 这是svg output
这里是原pdf

3 个答案:

答案 0 :(得分:2)

由于您可能不明白的原因,您的PDF有点困难。

它的核心问题是文档中的某些图形实际上是使用自定义字形绘制的。如果您将文本复制并粘贴到Acrobat中,则可以看到此信息。那里有各种各样不寻常的角色似乎没有任何用处。这就是SVG底部的那些正方形,其中包含EE和FF。

然而,这些字符实际上是自定义字形,例如页面底部矩阵周围的大括号。所以它们都非常重要,而且对本文档也非常具体。

我尝试使用ABCpdf .NET将您的PDF转换为SVG。除了底部的这些自定义字形外,它工作得很好。输出大约是90KB。它看起来非常类似于你的inkscape SVG输出,但只是更小一点(inkscape一个是160KB)。

摆脱这些非Unicode字形的唯一方法是对文本进行矢量化。我使用ABCpdf做了这个,输出在SVG中看起来很好。但是......矢量化文本很大,SVG不是特别有效的媒介。输出大约1MB!拉链下降到一半,但它仍然没有 - 在原来的PDF附近有效率。

无论你使用什么格式,我在这里看到的问题都将是普遍存在的。无论您输出到SVG,SWF,HTML画布,VML还是任何矢量格式,这些自定义字符总是会有问题。

那我会建议什么?那么在网络上广泛使用的明显的矢量格式是...... PDF!

我知道这不是你想要的,但我认为这是考虑到上述限制的现实解决方案。 : - )

答案 1 :(得分:2)

我能找到的唯一解决方案就是插画家。 只需打开pdf,保存为svg,然后选择嵌入所有使用过的字形。 结果很完美:

https://dl.dropboxusercontent.com/u/58922976/Sol-10.1.svg

答案 2 :(得分:1)

如果没有闪光灯的平台使用闪光灯+光栅图像怎么样,如果闪光灯主要适合你?