我想用脚本获取页面标题。到目前为止,我能想出的唯一解决方案是它需要先加载整个页面,然后才能开始grep
<title>
。
由于标题始终是<head>
的一部分,因此只要有标题被提取就停止加载页面是有意义的。
我该怎么做?我愿意接受多种语言的解决方案。
答案 0 :(得分:1)
在PHP中,您可以使用file_get_contents
并限制字节数:
$file = file_get_contents('URL', FALSE, NULL, 0, x); //Only load first x bytes
preg_match("/<title>(.*)<\/title>/i", $file, $matches);
$title = $matches[0];
答案 1 :(得分:0)
如果支持HTTP服务器,您可以使用content-range限制下拉的数据量,并希望您下拉到达title元素。
答案 2 :(得分:0)
使用jQuery .load()/。ajax()方法