我正在做一种代理。我的php脚本下载一个网页,然后显示下载的内容。输出看起来不像原始网页,因为某些网址需要更正(css,链接,图片等)。所以我正在寻找一个包含src
和href
属性的所有html元素的库,以便我可以更改该值。例如:
<link href="/images/favicon.ico">
需要更改为
<link href="http://example.com/images/favicon.ico">
这样做的最佳方式是什么?
答案 0 :(得分:0)
<?php
require_once('controller/simple_html_dom.php');
$str = '<link rel="stylesheet" type="text/css" href="/css/normalize.css?StillNoSpring"/>
<script type="text/javascript" src="/js/heyoffline.js?StillNoSpring"></script>';
$html = str_get_html($str);
foreach($html->find('link[rel=stylesheet]') as $styleSheets) {
echo $styleSheets->getAttribute('href')."<br/>";
}
foreach($html->find('script[type=text/javascript]') as $scripts) {
echo $scripts->getAttribute('src')."<br/>";
}
?>
您将获得以下链接
/css/normalize.css?StillNoSpring
/js/heyoffline.js?StillNoSpring