使用HTTP_ACCEPT_LANGUAGE进行Google抓取错误

时间:2013-09-03 18:13:12

标签: php web-crawler googlebot http-accept-language

在我的Codeigniter应用中,我使用$_SERVER['HTTP_ACCEPT_LANGUAGE']来确定用户浏览器语言,以便根据它设置应用语言,如下所示:

public function __construct()
{
parent::__construct();

/* set session language if not set. "hu" if browser language "hu", else "en" */
    if(!($this->session->userdata("lang")))
        {
        $browserlang = substr($_SERVER["HTTP_ACCEPT_LANGUAGE"],0,2);
        if ($browserlang == "hu")
            {
            $this->config->set_item("language", "hu");
            $this->session->set_userdata("lang", "hu");
            $this->lang->load("bh_hu", "hungarian");
    }
         else
            {
            $this->config->set_item("language", "en");
            $this->session->set_userdata("lang", "en");
            $this->lang->load("bh_en", "english");
            }
        }
     else
        {
        switch ($this->session->userdata("lang"))
             {
             case "hu": $this->lang->load("bh_hu", "hungarian"); break;
             case "en": $this->lang->load("bh_en", "english"); break;
             }
        }

     ....
  }

一切正常,但由于Google抓取工具不发送任何HTTP_ACCEPT_LANGUAGE,因此在抓取所有网页时会返回php错误未定义索引:HTTP_ACCEPT_LANGUAGE

这真的很讨厌,因为php错误甚至填满了我的整个谷歌搜索片段。

有没有办法让谷歌机器人忽略HTTP_ACCEPT_LANGUAGE行动?

提前致谢!

2 个答案:

答案 0 :(得分:7)

$browser_lang = !empty($_SERVER['HTTP_ACCEPT_LANGUAGE']) ? strtok(strip_tags($_SERVER['HTTP_ACCEPT_LANGUAGE']), ',') : '';
$browser_lang = substr($browser_lang, 0,2);

// Now check if you support this language and set it
if(array_key_exists($browser_lang, $this->languages /* define this array to compare */))
    return $browser_lang;
else{
    // return default lang
}

答案 1 :(得分:6)

简单:

$browserlang = isset($_SERVER["HTTP_ACCEPT_LANGUAGE"]) ? substr($_SERVER["HTTP_ACCEPT_LANGUAGE"],0,2) : '';

这样,如果存在HTTP_ACCEPT_LANGUAGE标头,则使用它,否则将$ browserlang设置为空字符串'';如果未定义内部的内容,则isset()调用不会产生警告。