HTML到PDF的工作原理(特别是abcPDF)

时间:2012-01-30 09:17:50

标签: c# asp.net pdf pdf-generation

我的新项目是使用URL即时将HTML转换为PDF。 我在最初阶段搜索了很多并提出了解决方案,以便HTML转换为IMAGE,IMAGE转换为PDF。 但它不是理想的解决方案,因为用户无法从PDF文件中复制粘贴。

最近我遇到了abcPDF组件,你可以在这里查看他们的演示http://www.abcpdfeditor.com/

现在我想知道他们如何能够用所有这些功能制作出这么好的PDF。他们的逻辑是什么?我不认为他们会解析每个HTML标签来创建文档。你们有什么想法吗?

非常感谢任何帮助

1 个答案:

答案 0 :(得分:2)

简而言之,这就是大多数HTML到PDF转换的工作原理。

HTML ----转换为----> EMF(元文件/矢量图像)----> PDF

  1. 基本上,IE的渲染引擎(即MSHTML)有一些API,您可以通过它们将加载的HTML页面导出为Emf(增强型图元文件格式),这只是一个矢量图像。
  2. 为此,您可以使用此开源Web浏览器控件 http://groups.google.com/group/csexwb

    1. 然后,您必须将生成的EMF文件渲染到PDF页面。这通常称为EMF到PDF转换。根据我的理解,没有免费的Emf to PDF转换软件。但ITextsharp对WMF格式提供的支持很少。