我使用cURL下载了一个页面,并使用“PHP Simple HTML DOM Parser”解析了html。 问题是当它显示元素的外部html时,西班牙语字符不正确。 例如:
原文
la puja por la compra de los derechosdepublicaciónhasidolamás reñidadelaño。
显示的文字
la puja por la compra de los derechosdepublicaciónhasidolamá reñidadelaño。
什么会导致字母改变?
答案 0 :(得分:2)
我非常确定,因为它在输出中显示为多个字符,因为您尝试在单字节字符集中显示一些多字节UTF8字符(可能ISO-8859-1)。
看一下我刚才写的this blog post,它应该引导你解决所有潜在的问题。
答案 1 :(得分:1)
不正确的字符编码 - 确保整个编码是一致的,我建议使用UTF-8
答案 2 :(得分:0)
你必须确定下载页面的编码是什么,然后(例如通过iconv)将其转换为你的编码。