我正在使用简单的HTML DOM,并且在某些网站上使用它时会得到奇怪的结果。
以下是从this link
生成的HTML输出����������������
我检查了消息来源,这是一团糟。
每当我尝试使用它时它也会挂起on this site同样,HTML也是一团糟。
有什么想法吗?
编辑:添加了代码块:
下面的$str
变量在我的代码中在CURL请求中定义。
我正在使用CURL请求
$html = str_get_html($str);
$images = array();
if($html !='') {
foreach($html->find('img') as $element) {
if(strtolower(substr($element->src, -4)) != '.gif') {
$images[] = url_to_absolute($baseURL, $element->src);
}
}
}
答案 0 :(得分:0)
总是看起来像编码问题。
也许utf8_decode / utf8_encode可以提供帮助。
答案 1 :(得分:0)
我有这个问题,但不是charset问题是gzip compresion简单的html dom不处理这里是我的解决方案 Simple html dom character encoding issue