我正在寻找Java中的东西来阅读Word文档来处理他们的文本..我需要的只是文字,没什么特别的。我知道Apache POI,但它现在不包括对DOCX的支持,那里有什么东西?
答案 0 :(得分:5)
如果您不需要格式化信息,图像和所有其他花哨的东西,那么工作就容易多了。只需要5到10行代码即可。
仅当您需要纯文字时才适用。
答案 1 :(得分:3)
通过一些谷歌搜索我发现OpenXML4J。这可能会解决您的问题。在我确信社区中的某个人有更好的洞察力之前,我还没有用过这个。
注意:这是一个重复的问题。这有解决方案加上一些讨论。 Link to the question.
答案 2 :(得分:2)
尝试apache poi - 它可以处理doc,docx,xls,xlsx,ppt,pptx。
另一种生产级解决方案是无头模式的OpenOffice,甚至可以在服务器端场景中使用。
答案 3 :(得分:1)