我创建了一个curl函数,它返回页面上的所有html(以及cookie)
我想删除信息(还需要删除链接带来的脚本)
这是我的代码
<?php
/* gets the data from a URL */
function get_data($url) {
$ch = curl_init();
$timeout = 5;
$cookie_data =
implode(
"; ",
array_map(
function($k, $v) {
return "$k=$v";
},
array_keys($_COOKIE),
array_values($_COOKIE)
)
);
curl_setopt($ch, CURLOPT_COOKIE, $cookie_data);
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $timeout);
$data = curl_exec($ch);
curl_close($ch);
preg_replace('/<meta (.*) \/>/i','', $data);
return $data;
}
echo get_data('http://go.etracc.net/l/25492/2013-12-04/374rh');
}
?>
任何帮助都会很棒!
答案 0 :(得分:0)
您可以使用strip_tags和第二个参数来指定您希望保留的所有标记。
doc:保留a和p标签
的示例// Allow <p> and <a>
echo strip_tags($text, '<p><a>');