你好,
使用以下代码从URL中检索DOM 所有“A”标签并打印他们的HREF 现在我的输出包含“A”我不想让我的出局在这里 http://trend.remal.com/parsing.php
我需要在http://twitter.com/namehere
之后清除我的名字所以输出“namehere”的打印列表
include('simple_html_dom.php');
// Retrieve the DOM from a given URL
$html = file_get_html('http://tweepar.com/sa/1/');
$urls = array();
foreach ( $html->find('a') as $e )
{
// If it's a twitter link
if ( strpos($e->href, '://twitter.com/') !== false )
{
// and we don't have it in the array yet
if ( ! in_array($urls, $e->href) )
{
// add it to our array
$urls[] = $e->href;
}
}
}
echo implode('<br>', $urls);
echo $e->href . '<br>';
答案 0 :(得分:2)
不要只使用$urls[] = $e->href
,而是使用a regex to match用户名:
preg_match('~twitter.com/(.+)~', $e->href, $matches);
$urls[] = $matches[1];