我有一个PHP脚本,可以从网页上删除元标记和标题。它应该回应它们,但却什么都不做。我已尝试error_reporting(E_ALL)
,ini_set('display_errors',1);
等,但他们没有提供任何理由。
function file_get_contents_curl($url)
{
$ch = curl_init();
curl_setopt($ch, CURLOPT_HEADER, 0);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
$data = curl_exec($ch);
curl_close($ch);
return $data;
}
$html = file_get_contents_curl("http://www.tomato.co.uk/");
$doc = new DOMDocument();
@$doc->loadHTML($html);
$nodes = $doc->getElementsByTagName('title');
$title = $nodes->item(0)->nodeValue;
echo $title;
$metas = $doc->getElementsByTagName('meta');
for ($i = 0; $i < $metas->length; $i++)
{
$meta = $metas->item($i);
if($meta->getAttribute('name') == 'description')
$description = $meta->getAttribute('content');
echo $description;
if($meta->getAttribute('name') == 'keywords')
$keywords = $meta->getAttribute('content');
echo $keywords;
}
答案 0 :(得分:-1)
你的脚本适合我:
php t.php
tomatotomato是艺术家,设计师,音乐家和艺术家的集体 作家从事出版,展览,现场表演, 广告,建筑,时尚,公共设施,音乐, 电视,电影和平面设计.tomato是艺术家的集体, 设计师,音乐家和作家从事出版,展览, 现场表演,广告,建筑,时尚,公众 装置,音乐,电视,电影和平面设计.tomato是一个 从事艺术家,设计师,音乐家和作家的集体 出版,展览,现场表演,广告,建筑, 时尚,公共设施,音乐,电视,电影和图形 设计。
如果您是通过网络浏览器运行 - 请尝试查看来源 - 这不是有效的HTML。