XMLReader打破了奇怪的角色

时间:2011-10-21 17:44:53

标签: php xml parsing encoding xmlreader

每当XMLReader尝试解析这个XML文件时,它就会以“½”和“看起来像这个”的句点打破它。“

两者都是字符,每当我尝试从xml提要中删除它们时,编辑器首先删除它们前面的字符。因此,它们就像外来/不同的编码字符。

我可以选择修复它吗?我不能每次都编辑xml文件。非常感谢

1 个答案:

答案 0 :(得分:0)

您必须修复创建“XML”文件的程序或进程。 (我把“XML”放在引号中,因为实际上,你希望它是一个XML文件,但它不是一个。)你可能能够修补或修复或恢复数据,但这不是一个长期的溶液

轶事证据表明,“½”字符编码为两个字节,表明它编码为UTF-8,而“é”字符编码为一个字节,表明它编码为ISO 8859-1。这意味着两个不同的进程已写入文件,使用不同的编码写入它。 (也许它最初是在一个编码中创建的,然后使用不知道原始编码是什么的编辑器进行修改。)这样做不会起作用。