DOMCrawler找到带有内部HTML文本的Tag

时间:2015-03-23 23:01:55

标签: php symfony web-scraping goutte domcrawler

我尝试使用Goutte抓取网页,但我找不到DOMCrawler方法来搜索实际文字。我们假设td,但它没有类或ID。所以,我需要搜索让我们说" Title"然后得到td的下一个兄弟。

1 个答案:

答案 0 :(得分:0)

首先,我想向您推荐Node Filtering上的DomCrawlers文档,特别是DomCrawler::reduce()方法和Accessing Node Values

如果您对访问这些内容感到不满意,那么您可以随时下拉并使用DOMNode properties

当然,使用非常强大的XPath查询可能会更好。