我想知道是否可能以及我需要在url链接列表中循环并将这些页面保存为pdf。我想创建一个可以做到这一点的脚本,但不确定它是多么逼真。
示例:
www.site1.com - 在本地保存pdf site1.pdf www.site2.com - 在本地保存pdf site2.pdf
答案 0 :(得分:0)
虽然需要点编码,但这很现实,因为将HTML页面保存为PDF文件并不是那么简单。
像PHP的FPDF或mPDF这样的库可以将HTML文档转换为有效的pdf,但它不会采用页面的“屏幕截图”,而是从HTML标记和CSS构建它。他们甚至允许将CSS文件更改为自定义文件。
(如果你想截取屏幕截图,那么总是有PHP的imagegrabscreen()
,但它只适用于Windows服务器。)
您只需从网址中获取dom:
$html = file_get_contents('http://site1.com');
使用其中一个提到的库将其转换为pdf,并将其另存为文件:
$mpdf = new mPDF();
$mpdf->WriteHTML($html);
$mpdf->Output();
请参阅: http://fpdf.org
(我个人更喜欢mPDF - 它基于FPDF并且有一个简单易用的API。)