我正在尝试编写一个函数来从Facebook获取用户个人资料ID或用户名。他们将url输入到一个表单然后我试图弄清楚它是Facebook个人资料页面还是其他页面。问题是,如果他们进入应用页面或其他具有子域名的页面,我想忽略该请求。
现在我有:
$author_url = http://facebook.com/profile?id=12345;
if(preg_match("/facebook/i",$author_url)){
$parse_author_url = (parse_url($author_url));
$parse_author_url_q = $parse_author_url['query'];
if(preg_match('/id[=]([0-9]*)/', $parse_author_url_q, $match)){
$fb_id = "/".$match[1];}
else{ $fb_id = $parse_author_url['path'];
}
$grav_url= "http://graph.facebook.com".$fb_id."/picture?type=square";
}
echo $gav_url;
如果$author_url
具有“id =”,则将其用作配置文件ID,如果不是,那么它必须是用户名或页面名称,因此请使用它。我需要再运行一次检查,如果网址包含facebook,但是子网域会忽略它。我相信我可以在第一个preg_match preg_match("/facebook/i",$author_url)
谢谢!
答案 0 :(得分:1)
要忽略Facebook子域,您可以确保
$parse_author_url['host']
是facebook.com
。
如果还有其他内容,例如login.facebook.com
或apps.facebook.com
,则无需继续。
或者,您也可以确保网址以http://facebook.com
开头为:
if(preg_match("@(?:http://)?facebook@i",$author_url)){
答案 1 :(得分:0)
这不是你所要求的直接解决方案,但是这些部分可以做你需要做的事情。
我发现子域导致 parse_url 出现问题。即它返回的数组只包含 $ result ['path'] 而没有'host'或'scheme'。
我的理论是,如果 parse_url 没有'host'或'scheme'结果,并且字符串中有域后缀(.ext),那么一个子域名。
这是代码: ($ src是一个我必须从子域中排序相对src的URL):
$srcA = parse_url( $src );
//..if no scheme or host test if subdomain.
if( !$srcA['scheme'] && !$srcA['host'] ){
//..this string / array is set elsewhere but for this example I will put it here
$tld = "AC,AD,AE,AERO,AF,AG,AI,AL,AM,AN,AO,AQ,AR,ARPA,AS,ASIA,AT,AU,AW,AX,AZ,BA,BB,BD,BE,BF,BG,BH,BI,BIZ,BJ,BM,BN,BO,BR,BS,BT,BV,BW,BY,BZ,CA,CAT,CC,CD,CF,CG,CH,CI,CK,CL,CM,CN,CO,COM,COOP,CR,CU,CV,CW,CX,CY,CZ,DE,DJ,DK,DM,DO,DZ,EC,EDU,EE,EG,ER,ES,ET,EU,FI,FJ,FK,FM,FO,FR,GA,GB,GD,GE,GF,GG,GH,GI,GL,GM,GN,GOV,GP,GQ,GR,GS,GT,GU,GW,GY,HK,HM,HN,HR,HT,HU,ID,IE,IL,IM,IN,INFO,INT,IO,IQ,IR,IS,IT,JE,JM,JO,JOBS,JP,KE,KG,KH,KI,KM,KN,KP,KR,KW,KY,KZ,LA,LB,LC,LI,LK,LR,LS,LT,LU,LV,LY,MA,MC,MD,ME,MG,MH,MIL,MK,ML,MM,MN,MO,MOBI,MP,MQ,MR,MS,MT,MU,MUSEUM,MV,MW,MX,MY,MZ,NA,NAME,NC,NE,NET,NF,NG,NI,NL,NO,NP,NR,NU,NZ,OM,ORG,PA,PE,PF,PG,PH,PK,PL,PM,PN,POST,PR,PRO,PS,PT,PW,PY,QA,RE,RO,RS,RU,RW,SA,SB,SC,SD,SE,SG,SH,SI,SJ,SK,SL,SM,SN,SO,SR,ST,SU,SV,SX,SY,SZ,TC,TD,TEL,TF,TG,TH,TJ,TK,TL,TM,TN,TO,TP,TR,TRAVEL,TT,TV,TW,TZ,UA,UG,UK,US,UY,UZ,VA,VC,VE,VG,VI,VN,VU,WF,WS,XXX,YE,YT,ZA,ZM,ZW";
$tldA = explode( ',' , strtolower( $tld ) );
$isSubdomain = false;
foreach( $tldA as $tld ){
if( strstr( $src , '.'.$tld)!=false){
$isSubdomain = true;
break;
}
}
//..prefixing with the $host if it is not a subdomain.
$src = $isSubdomain ? $src : $src = $host . '/' . $srcA['path'];
}
可以通过在第一个'/'之前解析subdomain == true字符串并使用RegEx对字符进行测试来编写进一步的确认。
希望这可以帮助一些人。