如何在php中设置cURL才能获得网页的可打印版本?

时间:2016-03-29 13:49:01

标签: php html css curl

我正在尝试使用php中的cURL从其他人的网站复制HTML源代码。我只想获得他们指定的可打印的HTML,而不是他们的页眉和页脚和图像。我的目的是加快下载速度,减轻他们网站的负担。他们8年来第一次更新了他们的页面,并改为使用CSS而不是GET变量来指定页面的可打印版本。有可能告诉cURL只返回可打印的元素吗? 编辑:他们在CSS中使用了很多这样的语句:

@media print {
    .visible-print-block {
        display: block !important;
    }
}

1 个答案:

答案 0 :(得分:0)

可能这不是您期望的答案,但除了解析DOM树并自己呈现HTML之外,您无法生成可打印版本。

然而在1999年,对于基于网络的电子邮件,我们使用了类似的东西:

system("lynx --dump 'www.microsoft.com'");

这很有效,但是:

  • 可能在linuxMacOSWindows上开箱即用,您需要安装lynx浏览器。
  • 它很慢 - 因为fork lynx浏览器
  • 您需要注意并对域进行编码,可能需要使用escapeshellarg
  • lynx不支持Javascript,也不支持非常高级CSS

另一种方法是使用许多软件包中的一些来制作屏幕截图。然而,它们将产生图像而不是文本。