我使用Symfony Dom Crawler进行html解析,我需要找到不同html页面上的所有rss链接。这些链接看起来不同,例如:
<a href="logical/footer/news.rss" class="footer__link">RSS</a>
或
<link rel="alternate" type="application/rss+xml" href="rss/all">
或
<li href="rss/rss.xml">some text</li>
...等 至于第二个例子,我可以将链接挂钩到链接类型(application / rss + xml),但这不适用于第一个或第三个例子。我已经尝试了以下内容:
$crawler->filter('a[href='.preg_match_all('/[a-zA-Z\"\'\/.]+.xml\"/uis', $text).']')
但不幸的是它没有用。也许有一种方法来过滤包含特定文本的所有元素,例如RSS?任何帮助,将不胜感激。谢谢。