PHP输出正常的问号而不是'或'

时间:2009-09-25 09:38:29

标签: php xml parsing encoding

我正在解析RSS提要并在描述字段中对html进行子解析,以便创建自定义XML结构。

在描述字段中有'和'符号,PHP将它们作为常规问号输出。怎么样?

我尝试过不同的编码,如UTF-8和iso-8859-1,但没有任何作用..

这是我正在解析的http://www.ilovetechno.be/artists_rss.xml

的xml

这是解析http://www.crowdsurferapp.com/clients/ilovetechno/

的方法

3 个答案:

答案 0 :(得分:3)

有一个predefined order in that the encoding of a XML document is to be determined

    HTTP header field Content-Type中的
  1. charset参数:

    Content-Type: application/xml; charset=<character encoding>
  2. XML declaration中的
  3. encoding属性:

    &lt;?xml version =“1.0”encoding =“&lt; character encoding&gt; ”?&gt;

  4. 如果两者都缺失,则使用默认字符编码(UTF-8或UTF-16)。

    因此,为了使用正确的编码解析XML文档,您需要查找这些信息。请查看问题PHP: Detect encoding and make everything UTF-8以获取我的解决方案。

    我还建议您使用UTF-8进行内部处理,并将其作为输出编码,因为这是XML的默认字符编码之一。

答案 1 :(得分:0)

您还必须在html meta标记和/或http标题中设置正确的编码

答案 2 :(得分:0)

<?xml version="1.0" encoding="iso-8859-1"?> 

更改为utf-8。