西班牙语字符不正确

时间:2012-04-23 13:15:53

标签: php html curl

我使用cURL下载了一个页面,并使用“PHP Simple HTML DOM Parser”解析了html。 问题是当它显示元素的外部html时,西班牙语字符不正确。 例如:

原文

  

la puja por la compra de los derechosdepublicaciónhasidolamás   reñidadelaño。

显示的文字

  

la puja por la compra de los derechosdepublicaciónhasidolamá   reñidadelaño。

什么会导致字母改变?

3 个答案:

答案 0 :(得分:2)

我非常确定,因为它在输出中显示为多个字符,因为您尝试在单字节字符集中显示一些多字节UTF8字符(可能ISO-8859-1)。

看一下我刚才写的this blog post,它应该引导你解决所有潜在的问题。

答案 1 :(得分:1)

不正确的字符编码 - 确保整个编码是一致的,我建议使用UTF-8

答案 2 :(得分:0)

你必须确定下载页面的编码是什么,然后(例如通过iconv)将其转换为你的编码。

请参阅PHP: Convert curl_exec output to UTF8