调整PHP代码从给定的URL中检索DOM

时间:2012-09-09 10:39:17

标签: php html

你好,

使用以下代码从URL中检索DOM  所有“A”标签并打印他们的HREF 现在我的输出包含“A”我不想让我的出局在这里 http://trend.remal.com/parsing.php

我需要在http://twitter.com/namehere

之后清除我的名字

所以输出“namehere”的打印列表

    include('simple_html_dom.php');

 // Retrieve the DOM from a given URL
 $html = file_get_html('http://tweepar.com/sa/1/');
 $urls = array();

  foreach ( $html->find('a') as $e )
  {
  // If it's a twitter link
  if ( strpos($e->href, '://twitter.com/') !== false )
  {
    // and we don't have it in the array yet
    if ( ! in_array($urls, $e->href) )
    {
        // add it to our array
        $urls[] = $e->href;
    }
   }
   }

  echo implode('<br>', $urls);

echo $e->href . '<br>';

1 个答案:

答案 0 :(得分:2)

不要只使用$urls[] = $e->href,而是使用a regex to match用户名:

preg_match('~twitter.com/(.+)~', $e->href, $matches);
$urls[] = $matches[1];