获取HTML语言和网站区域

时间:2018-01-30 15:10:47

标签: php

简短说明:

这是我编写的一段代码,它是我用来索引内部页面的更大脚本的一部分。我想要做的是获取网站的语言和区域,如果有指定。到目前为止,我有以下代码,但并非在所有情况下都有效。

问题:

有时候随机页面中有这些标签,似乎由于某些原因它们没有被提取。

代码:

/contacts/new

问题:

上面还有更好的编码方式吗? 有没有更好的方法来获得这两个值?

1 个答案:

答案 0 :(得分:0)

信不信由你,但经过一些测试后我添加了以下内容:

// strip whitespaces from url

        $link = preg_replace('/\s+/', ' ',$link);
        $link = preg_replace(array('/\s{2,}/', '/[\t\n]/'), ' ', $link);
        $link = preg_replace("/[[:blank:]]+/"," ",$link);
        $link = preg_replace('~\x{00a0}~','',$link); 

然后99%的案例找不到我知道区域标签的地方终于找到了。所以我想我解决了自己的问题。好,谢谢你。