Question

我想用脚本获取页面标题。到目前为止，我能想出的唯一解决方案是它需要先加载整个页面，然后才能开始grep <title>。

由于标题始终是<head>的一部分，因此只要有标题被提取就停止加载页面是有意义的。

我该怎么做？我愿意接受多种语言的解决方案。

Answer 1

在PHP中，您可以使用file_get_contents并限制字节数：

$file = file_get_contents('URL', FALSE, NULL, 0, x);  //Only load first x bytes
preg_match("/<title>(.*)<\/title>/i", $file, $matches);
$title = $matches[0];

Answer 2

如果支持HTTP服务器，您可以使用content-range限制下拉的数据量，并希望您下拉到达title元素。

Answer 3

使用jQuery .load（）/。ajax（）方法

检查jQuery .load() API reference

在不加载整个页面的情况下提取HTML页面的标题

3 个答案: