希望开发能够处理文档的服务器端应用程序。源文档主要是MS-Word 2003,2007,即Docx的MS版本。希望服务器应用程序能够在Linux或Windows上运行。 想知道什么是在linux下读写MS-Word文件的最佳工具或库。兼容性是最重要的考虑因素。必须保留源文档格式,包括表格。
我见过一种类似的帖子here,但它特定于python。我不关心使用什么语言或库,只要它们可用于Windows和Linux 一定不能要求MS-Word读取Word文件 我知道Open Office,但我正在寻找一种与MS-Word文件具有高度兼容性的解决方案。 刚刚遇到这个看起来很有希望的解决方案。 aspose.com 任何人都有使用Aspose.Words for Java或类似第三方软件包的经验吗?它看起来很有前景,但是对于OEM订阅而言价格超过2万美元。也就是说,如果它按照宣传的方式提供,它可能仍然是那里的最佳解决方案。
感谢 有一些建议,但到目前为止没有任何建议符合法案(或预算)。
答案 0 :(得分:5)
您是否考虑过使用b2xtranslator将二进制.doc转换为.docx。 (在Linux上,你必须在Mono中运行它)
然后,您可以使用POI或docx4j来操作docx。如果您需要保存为.doc,则不是解决方案(除非您为该位使用OO)
答案 1 :(得分:0)
好的,我还有另一个答案; - )
使用unaconv
怎么样?它可以将OpenOffice可以读取的任何文件转换为OpenOffice可以编写的任何文件。您应该可以使用它来转换MS-Word文档/从MS-Word文档转换(如果它们不是太复杂,我发现开放式办公室无法很好地处理)。
唯一需要注意的是,你需要在linux服务器上运行一个OpenOffice实例,以便unoconv与之交互。
答案 2 :(得分:-1)
Mono最近获得了对system.io.packaging .net类的支持,该类允许对docx文件进行一定程度的操作。如果您想要做的事情是添加/删除资源并对文本进行递归,那么这可能是正确的。