字符串操作函数检索URL的问题

时间:2011-07-19 11:02:12

标签: php regex preg-replace

我建立了一个简单的刮板来获取其他网站的链接 我现在的问题是获取自己的链接而不是所有的内容

<a onclick="javascript:_gaq.push(['_trackEvent','outbound-article','namobile.naughtyamerica.com']);" href="http://www.wwww.com/track/MTA3ODQxLjEyLjQwLjQwLjAuMC4wLjAuMA/freeporn3/lisa_ann6/7535/"><img class="aligncenter size-full" title="Lisa Ann" src="http://www.www.com/upload/source/mfhm/lisawill/lisawillhor_gmna_big_img3.jpg" alt="Lisa Ann" width="313" height="223" /></a>

这里的图像及其链接我需要仅在变量中获取链接

$url = "http://www.wwww.com/track/MTA3ODQxLjEyLjQwLjQwLjAuMC4wLjAuMA/freeporn3/lisa_ann6/7535/";

它感谢你

3 个答案:

答案 0 :(得分:0)

使用queryPath,Simple HTML DOM Parser或其他PHP库在DOM文档中导航

答案 1 :(得分:0)

如果您熟悉CSS选择器,则可以使用PHP Query libraryattr method

<?php 
echo pq('a')->attr('href');

答案 2 :(得分:0)

$html = <<< EOF
<a onclick="javascript:_gaq.push(['_trackEvent','outbound-article','namobile.naughtyamerica.com']);" href="http://www.wwww.com/track/MTA3ODQxLjEyLjQwLjQwLjAuMC4wLjAuMA/freeporn3/lisa_ann6/7535/"><img class="aligncenter size-full" title="Lisa Ann" src="http://www.www.com/upload/source/mfhm/lisawill/lisawillhor_gmna_big_img3.jpg" alt="Lisa Ann" width="313" height="223" /></a>
EOF;

preg_match_all('/<a onclick.*?href="(.*?)"/im', $html, $url, PREG_PATTERN_ORDER);
$url = $url[1][0];


echo $url // echo's "http://www.wwww.com/track/MTA3ODQxLjEyLjQwLjQwLjAuMC4wLjAuMA/freeporn3/lisa_ann6/7535/"