需要找到损坏的文件(docx文件格式)

时间:2011-03-10 06:11:27

标签: java xslt

我正在使用xslt将我的html转换为docx文件格式(以开放式办公室xml格式)。当我在word中打开一些生成的docx文件时,它显示错误(可能是xml节点中的错误)。是否有可能在打开时查找创建的文档是打开还是显示错误或者是否可以以编程方式恢复文档(什么如果文档包含错误,请执行以下操作)?或者在我们的代码中用来恢复的任何单词api

请帮助我..提前致谢...

3 个答案:

答案 0 :(得分:1)

尝试检查word / _rels中的关系xml文件,并将其与工作docx进行对比。当我忘记在那里添加相应的条目时,我的docx文件被破坏了。

更新: 另请检查所有图像文件扩展名是否在[Content_Types] .xml文件中定义。

答案 1 :(得分:0)

  

是否可以在打开时查找创建的文档是打开还是显示错误

理论上,您应该能够使用验证XML解析器来针对OOXML的XML模式验证您创建的文档。在实践中:

  • 您可能需要搜索以查找相关模式的机器可读版本。
  • 问题是由于架构验证无法解决的问题,这是不可想象的。

  

是否可以以编程方式恢复文档(如果文档包含错误,该怎么办?)

一般没有。如果该文档与MS Office期望的文档大不相同,它将无法“制造它的头部或尾部”。 (这不是神奇的......)

  

或在我们的代码中用于恢复的任何单词api

再一次,没有。如果文档与架构有很大不同,那么符合架构的读取器/写入器API将无法应对它。


真正的解决方案是找出转换软件中的错误并纠正它们。除了验证架构之外,不太可能有任何真正的捷径。

答案 2 :(得分:-1)

可能您的文件可能已损坏。为此,您需要使用第三方文字恢复工具来恢复它。