两个.DOCX文件 - 相同但不同

时间:2011-12-05 21:24:00

标签: xml ms-office docx

背景

我们有一个应用程序可以监控电子邮件收件箱并接收电子邮件及其附件,并将名为ImageMAKER(http://www.imgmaker.com/)的第三方工具整合到.TIFF文件中。这个过程大部分时间都可以正常工作。但是,我们会得到.DOCX附件,这些错误会导致错误。如果我们获取原始文件,打开它并再次保存(不做任何更改),文件的大小将会改变,当我们将其放回系统时,该过程将很乐意处理它。无论我们是将其重命名并将其保存到与原始目录相同的目录中,还是保留原始名称并将其保存到另一个目录,就是这种情况。在Microsoft Word中查看时,这两个文件明显相同。

发现到目前为止

要进行故障排除,我们已将原始文件和重新保存文件的扩展名更改为.ZIP,并比较了每个文件的“docProps \ app.xml”文件并发现了奇怪的差异。在此特定示例中,该文档是一个10页的.DOCX文件。但是,原始文件的app.xml表示它是2页,而我们从原始文件保存的文件表示10.单词,字符和行也是关闭的。

这样的文件似乎来自特定客户,而不是来自其他任何人,但我们从他们那里得到的文件比坏文件更好。假设在将.DOCX文件发送给我们之前原始的app.xml没有被篡改,是否有人知道可能导致这种情况的原因是什么?我确信我们最终还是需要联系客户,但我们需要弹药才能回复“我们在最后没有做错任何事”。

编辑:

这些也来自其他客户。

来自原始文件的app.xml original file

来自重新保存文件的

app.xml resaved file

提前致谢!

0 个答案:

没有答案