我有一个HTML(不是XHTML)文档,可以在Firefox 3和IE 7中呈现。它使用相当基本的CSS来设置样式并在HTML中呈现得很好。
我现在正在采用将其转换为PDF的方法。我试过了:
我尝试了一个名为Html2Pdf Pilot的Windows应用程序实际上做得相当不错,但我需要的东西至少在Linux上运行,理想情况下通过Web服务器上的PHP按需运行。
我缺少什么,或者我该如何解决这个问题?
答案 0 :(得分:655)
看看wkhtmltopdf
。它是开源的,基于webkit和免费。
我们写了一个小教程here。
编辑(2017):
如果今天要建造一些东西,我就不会再去那条路了 但是会使用http://pdfkit.org/代替 可能会剥夺其所有nodejs依赖项,以便在浏览器中运行。
答案 1 :(得分:514)
重要:强> 请注意,这个答案是在2009年写的,它可能不是2019年的最具成本效益的解决方案。今天的在线替代品比当时更好。
以下是您可以使用的一些在线服务:
查看PrinceXML。
它绝对是最好的HTML / CSS到PDF转换器,虽然它不是免费的(但是,嘿,你的编程可能也不是免费的,所以如果它可以节省你10个小时的工作,你就可以免费回家了(因为你还需要考虑到替代解决方案将要求您使用正确的软件设置专用服务器)
哦,是的,我是否提到这是第一个(也可能是唯一的)HTML2PDF解决方案,它可以完整ACID2?
答案 2 :(得分:147)
经过一些调查和一般的拔毛后,解决方案似乎是HTML2PDF。 DOMPDF做了一个糟糕的工作,包括表格,边框甚至是中等复杂的布局,htmldoc似乎相当健壮,但几乎完全是CSS无知的,我不想回到没有CSS的HTML布局该计划。
HTML2PDF看起来最有希望,但我一直有关于node_type的空引用参数的这个奇怪的错误。我终于找到了解决方案。基本上,PHP 5.1.x在任何大小的字符串上使用正则表达式替换(preg_replace_ *)都可以正常工作。 PHP 5.2.1引入了一个名为 pcre.backtrack_limit 的php.ini配置指令。此配置参数的作用是限制完成匹配的字符串长度。为什么这是介绍我不知道。默认值选择为100,000。为什么这么低的价值呢?再一次,不知道。
bug was raised against PHP 5.2.1 for this,差不多两年后仍然 。
令人恐惧的是,当超出限制时,替换只是默默地失败。至少如果一个错误被提出并记录下来,你就会知道发生了什么,为什么以及要修改什么来修复它。但没有。
所以我有一个70k的HTML文件变成PDF。它需要以下php.ini设置:
现在精明的读者可能已经注意到我的HTML文件小于100k。我可以猜到为什么我遇到这个问题的唯一原因是html2pdf转换为xhtml作为过程的一部分。也许这让我过去了(虽然近50%的膨胀看起来很奇怪)。无论如何,上述工作都有效。
现在,html2pdf是一种资源匮乏。我的70k文件需要大约5分钟和至少500-600M的RAM来创建35页的PDF文件。不幸的是,实时下载速度不够快(到目前为止)并且内存使用率使内存使用率大约为1000比1(700k文件的RAM为600M),这完全是荒谬的。
不幸的是,这是我提出的最好的。
答案 3 :(得分:121)
为什么不试试mPDF version 2.0?我用它来创建PDF文档。它工作正常。
与此同时,mPDF版本为5.7,并且与HTML2PS / HTML2PDF相比,它是主动维护的
但请记住,文档真的很难处理。例如,请查看此页面:https://mpdf.github.io/。
围绕html到pdf的非常基本的任务可以使用这个库完成,但更复杂的任务需要一些时间阅读和“理解”文档。
答案 4 :(得分:66)
a)在yourfolder
b)在yourfolder
中创建 file.php 并插入此类代码:
<?php
include('../mpdf.php');
$mpdf=new mPDF();
$mpdf->WriteHTML('<p style="color:red;">Hallo World<br/>Fisrt sentencee</p>');
$mpdf->Output(); exit;
?>
c)从浏览器中打开 file.php
1)将 pdftohtml.exe 提取到根文件夹:
2)在该文件夹中,在 anyfile.php 文件中,放置此代码(假设,还有一个源example.pdf):
<?php
$source="example.pdf";
$output_fold="FinalFolder";
if (!file_exists($output_fold)) { mkdir($output_fold, 0777, true);}
$result= passthru("pdftohtml $source $output_fold/new_filename",$log);
//var_dump($result); var_dump($log);
?>
3)输入 FinalFolder ,然后会有转换后的文件(与源PDF一样多的页面)。
答案 5 :(得分:55)
结帐TCPDF。它具有一些HTML到PDF功能,可能足以满足您的需求。它也是免费的!
答案 6 :(得分:30)
我建议 DocRaptor (使用PrinceXML
作为“引擎”)
答案 7 :(得分:28)
只是为了碰撞线程,我尝试了DOMPDF,它运行得很好。我已经使用DIV
和其他块级元素来定位所有内容,我严格遵守CSS 2.1并且它的播放效果非常好。
答案 8 :(得分:28)
好消息! Snappy !! 强>
Snappy是一个非常简单的开源PHP5库,允许从url或html页面生成缩略图,快照或PDF。并且...它使用优秀基于webkit的 wkhtmltopdf
享受! ^ _ ^
答案 9 :(得分:28)
已经提到过,但我想确认mpdf是最简单,最强大,最免费的HTML到pdf转换器。天空真的是极限。您甚至可以生成动态的,用户生成的数据的pdf。
例如,客户想要一个CMS系统,这样他就可以更新他在俱乐部播放的音乐的曲目列表。这没问题,但他也希望用户能够下载播放列表的.pdf,所以这个可下载的pdf也必须由cms更新。感谢mpdf,有一些简单的循环和散布的变量,我可以做到这一点。我认为会花费数周时间的东西花了我几分钟。
伟大的article让我开始了。
答案 10 :(得分:24)
如果您想找到一个完美的XHTML + CSS到PDF转换器库,那就别忘了。这远非可能。因为它就像找到一个完美的浏览器(XHTML + CSS渲染引擎)。我们有吗? IE或FF?
我在DOMPDF上取得了一些成功。问题是你必须修改HTML + CSS代码以适应库的工作方式。除此之外,我的成绩非常好。
见下文:
答案 11 :(得分:24)
最初在开篇文章中提到的 HTML2PDF和HTML2PS 是在讨论带有此link的2009年套餐
但是有一个更好的HTML2PDF
它基于TCPDF,但部分是法语。
您可以在页面上重复使用表格页眉或页脚,并具有页码和总页数。见its examples。我已经使用它超过三年并推荐它。
答案 12 :(得分:20)
我使用fpdf使用PHP生成PDF文件。到目前为止,它对我来说很有效,可以产生简单的输出。
答案 13 :(得分:20)
答案 14 :(得分:15)
答案 15 :(得分:15)
尝试抓住最新的每晚 dompdf 构建 - 我使用的是旧版本,这是一个非常糟糕的资源,并且永远用于渲染我的pdf。从here获得一夜之后。
只需几秒钟即可生成PDF - 而且它与 PrinceXML / Docraptor 一样精彩呈现。好像他们自从我上次使用它以来已经认真优化了 dompdf 代码!
答案 16 :(得分:13)
就成本而言,在许多情况下,使用网络服务(API)可能是更明智的方法。此外,通过外包此流程,您可以放弃自己的基础架构/后端,并且 - 如果您使用的是信誉良好的服务 - 确保兼容调整Web标准,正常运行时间,缩短处理时间和快速交付内容。
我已经对目前市场上的大部分网络服务进行了一些研究,请在下面找到我认为值得一提的API,基于价格/价值比率的订单。他们都提供预先组成的PHP类和包。
<强>质量:强>
将高质量的引擎PrinceXML
作为主干,DocRaptor显然可以提供最佳的PDF质量,返回高度精美且转换良好的PDF文档。但是,pdflayer API服务在这里非常接近。 Pdfcrowd不一定按质量得分,而是以处理速度得分。
<强>费用:强>
pdflayer.com - 如上所述,这里最具成本效益的选择是pdflayer.com,提供100个月度PDF和高级订阅的完全免费订阅计划,范围在9.99美元至119.99美元之间。 每月10,000份PDF文档的价格为39.99美元。
docraptor.com - 提供为期7天的免费试用期。高级订阅计划的价格从15美元到2250美元不等。 每月10,000份PDF文档的价格约为300.00美元。
pdfcrowd.com - 免费提供100个PDF 一次。高级订阅计划的价格从9美元到89美元不等。 每月10,000份PDF文档的价格约为49.00美元。
我已经使用了他们三个,这个文本应该帮助任何人决定,而不必支付所有这些。本文未被认可为任何一种产品,我与任何产品没有任何关系。
答案 17 :(得分:12)
答案 18 :(得分:11)
这个问题已经很老了,但没有看到有人提到CutyCapt所以我会:)
<强> CutyCapt 强>
CutyCapt是一个小型跨平台命令行实用程序 捕获WebKit将网页渲染成各种矢量和 位图格式,包括SVG,PDF,PS,PNG,JPEG,TIFF,GIF和BMP
答案 19 :(得分:9)
我开发了一个公共API来从网页构建PDF文件。它有一个很好的PHP客户端类,使它非常易于使用。它使用wkhtmltopdf在云中呈现PDF。
HTML中不需要任何特殊内容。在images / css / js链接中不需要绝对URL。也适用于localhost(开发机器)。
目前,该服务在4个Azure区域设有端点:美国东部,美国西部,欧盟北部,东南亚。
它很快,因为它使用专有协议将网页内容发送到API以转换为PDF。
它是可靠的,因为所有端点都是负载平衡的。
可用于测试或使用率低的免费帐户。网站上的详细信息:
答案 20 :(得分:9)
我不认为php类最适合用css渲染xHtml页面。
新css规则出台后会发生什么? (很快css 3.0 ......)
渲染html页面的最佳方式是浏览器。 Firefox 3.0本身可以“打印”pdf格式,torisugary开发了一个扩展(命令行打印)来使用它。 Here you'll find it.
无论如何,还有很多问题只是作为一个pdf转换器运行
目前,我认为wkhtmltopdf是最好的(也就是safari浏览器使用的那个),快速,快速,真棒。 是的,开源也是...... Give it a look
答案 21 :(得分:9)
也许您可以在将文件传递给转换器之前尝试使用Tidy。如果其中一个渲染器在某些HTML问题上窒息(如未关闭的标记),则可能有所帮助。
答案 22 :(得分:8)
我按顺序推荐TCPDF或DOMPDF。
答案 23 :(得分:7)
虽然已经提供了很多解决方案,但我推荐以下两个:
与前面提到的所有解决方案中的这两个API不同的是,除了使用CSS和JavaScript将HTML转换为PDF之外,它还提供PDF权限管理,水印和加密。因此,对于那些想要立即投入使用的人来说,它是一个多功能的解决方案。
免责声明:我为Kaiomi工作,这是一家经营这两个网站的公司。
答案 24 :(得分:7)
精细渲染并不意味着什么。它有效吗?
无论输入多么糟糕,所有浏览器都会尽最大努力在屏幕上显示内容。当然,他们不会做同样的事情。如果你想要与FireFox相同的渲染,你可以使用它的渲染引擎。有pdf生成器。不过,这是一项非常多的工作。
答案 25 :(得分:5)
使用PHP,HTML到PDF转换真的需要在服务器端发生吗?
我刚遇到jsPDF,这是一个使用HTML5 / JavaScript的客户端解决方案。麻省理工学院获得许可的code is on GitHub。
答案 26 :(得分:5)
TCPDF工作正常,没有依赖关系,是免费的,并且经常被修复。如果提供的HTML / CSS内容格式良好,则速度合理。我通常生成50 - 300 kB的HTML输入(包括CSS),并在1-3秒内获得PDF输出,包含10 - 15个PDF页面。
我强烈建议在将任何内容发送到TCPDF之前使用整洁库作为HTML漂亮的格式化程序。
答案 27 :(得分:4)
我为PHP尝试了很多不同的库。所有列出的我都试过了。 在我看来,TCPDF库是最佳的折衷性能/可用性。 安装和使用非常简单,在小型介质应用中也具有良好的性能。 如果您需要高性能和非常大的PDF文档,请使用Zend_PDF模块,但要准备好编码!
答案 28 :(得分:3)
答案 29 :(得分:2)
不是 PHP ,而是Java library,它完成了这件事:
Flying Saucer采用XML或XHTML并符合CSS 2.1标准 样式表,以呈现为PDF
可以通过system()
或类似的电话从 PHP 中使用。虽然它需要 XML 格式良好的input
。