是否可以帮助我找到一种方法,使用Goutte从元描述,元关键字和机器人内容中获取内容。另外,我如何定位<link rel="stylesheet" href="">
和<script>
?
以下是我过去获取<title>
内容的PHP:
require_once 'goutte.phar';
use Goutte\Client;
$client = new Client();
$crawler = $client->request('GET', 'http://stackoverflow.com/');
$crawler->filter('title')->each(function ($node) {
$content .= "Title: ".$node->text()."";
echo $content;
});
以下是Goutte的链接 - https://github.com/fabpot/goutte
答案 0 :(得分:7)
您可以使用:
$crawler->filterXpath('//meta[@name="description"]')->attr('content');