标签: xml encoding character-encoding
我们正在接收第三方公司的xml文件导出。 在查看这些文件时,我注意到一些奇怪的行看起来像xml在该部分已损坏,导致无法导入或验证该xml。
此图像显示其中一个“损坏”部分。
通常情况下,我只是向第三方公司发送消息,要求他们解决这些文件的错误,但我感兴趣的可能是造成这种“腐败”的原因。
我注意到的一些事情:
文件是通过FTP下载的。多个文件包含损坏部分的略微更改版本。但是,它们之间总共有16280个字符。
由于我多次重新加载文件,因此我几乎排除了传输过程中的错误。