我正在使用我创建的解析器解析网页...当我解析页面并回显内容时,我得到像â€
这样的字符为什么这样做,它应该是...
或任何其他字符,例如--
。
答案 0 :(得分:6)
奇怪的字符是由编码问题引起的,最好的办法是在回复之前将它们编码为UTF-8(确保页面也是UTF-8)。
您可以使用utf8_encode函数。
这是一个非常完整的答案 成功地做到了: Detect encoding and make everything UTF-8
答案 1 :(得分:3)
通常这些类型的字符来自错误的字符编码。从我的头脑中,您最好的解决方案是检查您为网页上提供字符编码的元标记创建的网页。像这样:
<meta content='text/html; charset=UTF-8' http-equiv='Content-Type'/>
确保您提供相同的字符编码。
答案 2 :(得分:1)
我用iconv("UTF-8","ISO-8859-1",$string)
解决这个问题它完成了工作,10个人