Eclipse word文档阅读器/文本提取器

时间:2015-06-04 12:54:42

标签: java eclipse eclipse-plugin ms-word

我需要创建一个脚本来从word文档中读取数据并使用Java处理它。当从文件中读出它时,文本变得完全搞砸了,这是可以理解的。

我的问题是Eclipse是否存在从文件中提取文本的插件?

1 个答案:

答案 0 :(得分:1)

您可以使用XWPF

使用apache poi
XWPFDocument wd = new XWPFDocument(InputStream);
XWPFWordExtractor wde = new XWPFWordExtractor(wd);

general instruction to read a file