我如何识别关系= NoFOLLOW链接

时间:2011-11-24 06:13:25

标签: php html regex

我想知道如何通过PHP REGEX识别URL中的Nofollow关系。

<a href="abc.html" rel="NOFOLLOW">How to check NOFOLLOW<a>

请给我解决方案以找到这些东西

1 个答案:

答案 0 :(得分:1)

您可以尝试使用诸如......之类的东西。

preg_match('/<a.+?rel="nofollow".*?>[\s\S]*?<\/a>/i', $html);

CodePad

但是你最好使用HTML解析器来处理正则表达式无法解决的问题。

$dom = new DOMDocument;

$dom->loadHTML($html);

$anchors = $dom->getElementsByTagName('a');

foreach($anchors as $anchor) {
   if ($anchor->hasAttribute('rel')) {
      $rel = preg_split('/\s+/', strtolower($anchor->getAttribute('rel')));

      if (in_array('nofollow', $rel)) {
         echo 'This anchor is "nofollow"\'d.';
      }
   }
}

CodePad