我正在解析RSS提要并在描述字段中对html进行子解析,以便创建自定义XML结构。
在描述字段中有'和'符号,PHP将它们作为常规问号输出。怎么样?
我尝试过不同的编码,如UTF-8和iso-8859-1,但没有任何作用..
的xml 的方法答案 0 :(得分:3)
有一个predefined order in that the encoding of a XML document is to be determined:
charset
参数:
Content-Type: application/xml; charset=<character encoding>
encoding
属性:
&lt;?xml version =“1.0”encoding =“&lt; character encoding&gt; ”?&gt;
如果两者都缺失,则使用默认字符编码(UTF-8或UTF-16)。
因此,为了使用正确的编码解析XML文档,您需要查找这些信息。请查看问题PHP: Detect encoding and make everything UTF-8以获取我的解决方案。
我还建议您使用UTF-8进行内部处理,并将其作为输出编码,因为这是XML的默认字符编码之一。
答案 1 :(得分:0)
您还必须在html meta
标记和/或http标题中设置正确的编码
答案 2 :(得分:0)
<?xml version="1.0" encoding="iso-8859-1"?>
更改为utf-8。