简短说明:
这是我编写的一段代码,它是我用来索引内部页面的更大脚本的一部分。我想要做的是获取网站的语言和区域,如果有指定。到目前为止,我有以下代码,但并非在所有情况下都有效。
问题:
有时候随机页面中有这些标签,似乎由于某些原因它们没有被提取。
代码:
/contacts/new
问题:
上面还有更好的编码方式吗? 有没有更好的方法来获得这两个值?
答案 0 :(得分:0)
信不信由你,但经过一些测试后我添加了以下内容:
// strip whitespaces from url
$link = preg_replace('/\s+/', ' ',$link);
$link = preg_replace(array('/\s{2,}/', '/[\t\n]/'), ' ', $link);
$link = preg_replace("/[[:blank:]]+/"," ",$link);
$link = preg_replace('~\x{00a0}~','',$link);
然后99%的案例找不到我知道区域标签的地方终于找到了。所以我想我解决了自己的问题。好,谢谢你。