应用错误收集

DOMCrawler找到带有内部HTML文本的Tag

时间：2015-03-23 23:01:55

标签： php symfony web-scraping goutte domcrawler

我尝试使用Goutte抓取网页，但我找不到DOMCrawler方法来搜索实际文字。我们假设td，但它没有类或ID。所以，我需要搜索让我们说＆＃34; Title＆＃34;然后得到td的下一个兄弟。

1 个答案:

答案 0 :(得分：0)

首先，我想向您推荐Node Filtering上的DomCrawlers文档，特别是DomCrawler::reduce()方法和Accessing Node Values

如果您对访问这些内容感到不满意，那么您可以随时下拉并使用DOMNode properties

当然，使用非常强大的XPath查询可能会更好。