检查parse_url中的子域

时间:2010-09-17 02:23:23

标签: php facebook subdomain preg-match parse-url

我正在尝试编写一个函数来从Facebook获取用户个人资料ID或用户名。他们将url输入到一个表单然后我试图弄清楚它是Facebook个人资料页面还是其他页面。问题是,如果他们进入应用页面或其他具有子域名的页面,我想忽略该请求。

现在我有:

    $author_url = http://facebook.com/profile?id=12345;
            if(preg_match("/facebook/i",$author_url)){
            $parse_author_url = (parse_url($author_url));
            $parse_author_url_q = $parse_author_url['query'];
                if(preg_match('/id[=]([0-9]*)/', $parse_author_url_q, $match)){
                    $fb_id = "/".$match[1];}
                else{ $fb_id = $parse_author_url['path'];
                }
            $grav_url= "http://graph.facebook.com".$fb_id."/picture?type=square";
}
echo $gav_url;

如果$author_url具有“id =”,则将其用作配置文件ID,如果不是,那么它必须是用户名或页面名称,因此请使用它。我需要再运行一次检查,如果网址包含facebook,但是子网域会忽略它。我相信我可以在第一个preg_match preg_match("/facebook/i",$author_url)

中做到这一点

谢谢!

2 个答案:

答案 0 :(得分:1)

要忽略Facebook子域,您可以确保

$parse_author_url['host']

facebook.com

如果还有其他内容,例如login.facebook.comapps.facebook.com,则无需继续。

或者,您也可以确保网址以http://facebook.com开头为:

if(preg_match("@(?:http://)?facebook@i",$author_url)){

答案 1 :(得分:0)

这不是你所要求的直接解决方案,但是这些部分可以做你需要做的事情。

我发现子域导致 parse_url 出现问题。即它返回的数组只包含 $ result ['path'] 而没有'host'或'scheme'

我的理论是,如果 parse_url 没有'host'或'scheme'结果,并且字符串中有域后缀(.ext),那么一个子域名。

这是代码: ($ src是一个我必须从子域中排序相对src的URL):

$srcA = parse_url( $src );
//..if no scheme or host test if subdomain.
if( !$srcA['scheme'] && !$srcA['host'] ){
    //..this string / array is set elsewhere but for this example I will put it here
    $tld = "AC,AD,AE,AERO,AF,AG,AI,AL,AM,AN,AO,AQ,AR,ARPA,AS,ASIA,AT,AU,AW,AX,AZ,BA,BB,BD,BE,BF,BG,BH,BI,BIZ,BJ,BM,BN,BO,BR,BS,BT,BV,BW,BY,BZ,CA,CAT,CC,CD,CF,CG,CH,CI,CK,CL,CM,CN,CO,COM,COOP,CR,CU,CV,CW,CX,CY,CZ,DE,DJ,DK,DM,DO,DZ,EC,EDU,EE,EG,ER,ES,ET,EU,FI,FJ,FK,FM,FO,FR,GA,GB,GD,GE,GF,GG,GH,GI,GL,GM,GN,GOV,GP,GQ,GR,GS,GT,GU,GW,GY,HK,HM,HN,HR,HT,HU,ID,IE,IL,IM,IN,INFO,INT,IO,IQ,IR,IS,IT,JE,JM,JO,JOBS,JP,KE,KG,KH,KI,KM,KN,KP,KR,KW,KY,KZ,LA,LB,LC,LI,LK,LR,LS,LT,LU,LV,LY,MA,MC,MD,ME,MG,MH,MIL,MK,ML,MM,MN,MO,MOBI,MP,MQ,MR,MS,MT,MU,MUSEUM,MV,MW,MX,MY,MZ,NA,NAME,NC,NE,NET,NF,NG,NI,NL,NO,NP,NR,NU,NZ,OM,ORG,PA,PE,PF,PG,PH,PK,PL,PM,PN,POST,PR,PRO,PS,PT,PW,PY,QA,RE,RO,RS,RU,RW,SA,SB,SC,SD,SE,SG,SH,SI,SJ,SK,SL,SM,SN,SO,SR,ST,SU,SV,SX,SY,SZ,TC,TD,TEL,TF,TG,TH,TJ,TK,TL,TM,TN,TO,TP,TR,TRAVEL,TT,TV,TW,TZ,UA,UG,UK,US,UY,UZ,VA,VC,VE,VG,VI,VN,VU,WF,WS,XXX,YE,YT,ZA,ZM,ZW";

    $tldA = explode( ',' , strtolower( $tld ) );

    $isSubdomain = false;
    foreach( $tldA as $tld ){
        if( strstr( $src , '.'.$tld)!=false){
            $isSubdomain = true;
            break;
        }            
    }
    //..prefixing with the $host if it is not a subdomain.
    $src = $isSubdomain ? $src : $src = $host . '/' . $srcA['path'];

}

可以通过在第一个'/'之前解析subdomain == true字符串并使用RegEx对字符进行测试来编写进一步的确认。

希望这可以帮助一些人。