简单的html dom返回一些URL的奇怪结果

时间:2012-01-18 08:25:59

标签: php simple-html-dom

我正在使用简单的HTML DOM,并且在某些网站上使用它时会得到奇怪的结果。

以下是从this link

生成的HTML输出
���������������� 

我检查了消息来源,这是一团糟。

每当我尝试使用它时它也会挂起on this site同样,HTML也是一团糟。

有什么想法吗?

编辑:添加了代码块:

下面的$str变量在我的代码中在CURL请求中定义。

我正在使用CURL请求

$html = str_get_html($str);
$images = array();
if($html !='') {
    foreach($html->find('img') as $element) {
        if(strtolower(substr($element->src, -4)) != '.gif') {
            $images[] = url_to_absolute($baseURL, $element->src);
            }
    }
}

2 个答案:

答案 0 :(得分:0)

总是看起来像编码问题。

也许utf8_decode / utf8_encode可以提供帮助。

答案 1 :(得分:0)

我有这个问题,但不是charset问题是gzip compresion简单的html dom不处理这里是我的解决方案 Simple html dom character encoding issue