Regex是搜索某些文本组合的HTML的唯一方法,还是在这种情况下我可以使用XPath?

时间:2012-07-19 01:24:54

标签: php html dom xpath

我已经读过有一种方法可以在php 5.3+中使用带有xpath的正则表达式但是我没有那个版本而且由于某些原因无法升级。

所以我想知道是否有一种方法可以使用Xpath实现以下目标,或者我应该坚持使用正则表达式。我希望能够检查HTML文档是否包含/匹配以下某些内容:

  • {Powered by|Script Source:|....} <a href='some-domain.com'>Text 1|Text 2|...</a> [e.g. should match: Powered by <a href='http://wordpress.com'>Wordpress</a>

  • <img src='....' alt='img-[0-9]-[a-zA-Z].(jpg|png)'>

  • <script src='contains particular script'>

有没有办法通过xpath查询实现上述任何条件,同时又不影响速度和效率?

1 个答案:

答案 0 :(得分:1)

这是一个带有Simple HTML DOM的PHP脚本:

Example

我已将代码和结果放在该页面上。

字符串/ URL / src可以放在一个数组中。

当它在数组中循环时,它会测试链接href和内容script src,并将img src与正则表达式。