我必须读取一个.doc或.docx文档,其中包含一些静态字段,如title,header和一个用Java编写的程序。 使用相同的程序,用户填写表格(GUI),所有这些信息应添加到先前阅读的文档中的正确位置。
哪种框架最适合我的工作?
答案 0 :(得分:0)
请参阅apache-poi-or-docx4j-for-dealing-with-docx-documents
有关在文档中添加文字的技巧,请参阅document-generation
docx4j主要用于docx(和pptx,xlsx)文件。就遗留二进制文档而言,您有几个选择:
使用POI的HWPF支持。这包含在docx4j中作为依赖项。但它不是一个好方法,因为它没有将doc转换为docx4j的内部表示: - 你有点陷入HWPF土地
使用JODConverter将doc转换为docx,如有必要,再将其转换回来。这是最好的方式。