XML包含具有未知编码的奇怪字符

时间:2018-05-02 14:10:24

标签: xml encoding character-encoding

我们正在接收第三方公司的xml文件导出。 在查看这些文件时,我注意到一些奇怪的行看起来像xml在该部分已损坏,导致无法导入或验证该xml。

此图像显示其中一个“损坏”部分。 enter image description here

通常情况下,我只是向第三方公司发送消息,要求他们解决这些文件的错误,但我感兴趣的可能是造成这种“腐败”的原因。

我注意到的一些事情:

  • 每隔16280个字符就会重复一次。
  • 每个文件的字符总是相同的“设置”,但在其他文件中它们可能略有不同。

文件是通过FTP下载的。多个文件包含损坏部分的略微更改版本。但是,它们之间总共有16280个字符。

由于我多次重新加载文件,因此我几乎排除了传输过程中的错误。

0 个答案:

没有答案