在不加载整个页面的情况下提取HTML页面的标题

时间:2013-07-22 15:04:29

标签: html

我想用脚本获取页面标题。到目前为止,我能想出的唯一解决方案是它需要先加载整个页面,然后才能开始grep <title>

由于标题始终是<head>的一部分,因此只要有标题被提取就停止加载页面是有意义的。

我该怎么做?我愿意接受多种语言的解决方案。

3 个答案:

答案 0 :(得分:1)

在PHP中,您可以使用file_get_contents并限制字节数:

$file = file_get_contents('URL', FALSE, NULL, 0, x);  //Only load first x bytes
preg_match("/<title>(.*)<\/title>/i", $file, $matches);
$title = $matches[0];

答案 1 :(得分:0)

如果支持HTTP服务器,您可以使用content-range限制下拉的数据量,并希望您下拉到达title元素。

答案 2 :(得分:0)

使用jQuery .load()/。ajax()方法

检查jQuery .load() API reference