将不同的语言字符和重音解析为有效的XML

时间:2011-07-27 15:25:01

标签: php xml character-encoding

我有一堆带有不同语言数据的XML数据,它们有重音符号。例如: -

<text content="vídeo..." /> or <text content="vidéo..." />

这些数据来自MySQL - 我正在使用SimpleXML汇总数据 - 当这些字符在内容中时,它甚至拒绝将数据放入。

尝试(就像有人建议的那样)使用utf8_encode()对数据进行预测,看看是否有帮助。

我错过了一些明显的东西吗?

1 个答案:

答案 0 :(得分:1)

欢迎使用字符编码。首先,您必须确保使用与您的XML使用位置匹配的编码。用于添加数据的编码必须与XML文件中的相同。如果它只适合您的环境,您可以使用最适合您的编码,但如果您需要它在全球范围内工作,UTF-8是您最好的选择。

如果您的编码中有未知的字符,则必须将字符串编码为字符引用。如果您使用实体引用和htmlentities()执行此操作,则必须添加一些DTD以及对XML文件的实体引用,因为XML只知道少数默认值。如果您需要一些DTD,可以下载它们here。如果您不能使用DTD,则必须在XML文件中使用数字引用。