尝试在div id = firehoselist中获取h2中的所有内容(以获取文章的标题),但以下代码仅返回第一个结果。有任何想法
$crawler = new Crawler($content);
$crawler->filterXPath('//div[@id="firehoselist"]//*')->each(function (Crawler $node) use (&$results) {
$results[] = trim($node->filter('h2')->text());
});
内容我试图刮去太乱了,不能在这里发帖,但它来自slashdot org网站
答案 0 :(得分:1)
//div[@id="firehoselist"]
正在寻找ID <{1}}的每个元素,并且只会获得此条目的{strong>第一个结果{{1 }}
您需要的是获取每个 firehoselist
已解析的html:
$node->filter('h2')->text()