需要有关android中读取.doc文件的建议

时间:2015-01-29 05:21:56

标签: android apache-poi document docx4j

我将开发一个新的应用程序,它读取.doc和.docx文件,并从特定的word文档中获取单词数,行数,页数,图像数,没有公式。

因此,我使用Java Scanner类从单词文档中获取单词和行数,但是我无法获得页数和图像数。

之后我找到了一个API(Apache POI),它具有我需要的类似属性。

这是我的问题:Apache POI(不支持.docx)是重量级的jar。那么有没有替代Jar可用于获取页码,没有图像文件中出现的图像?

请建议。提前致谢。

1 个答案:

答案 0 :(得分:1)

您可以使用带有FileInputStream的Scanner而不是带有FileReader的BufferedReader。例如: -

File file = new File("sample.txt");
Scanner sc = new Scanner(new FileInputStream(file));
int count=0;
while(sc.hasNext()){
    sc.next();
    count++;
}
System.out.println("Number of words: " + count);

希望不是使用重型罐子,这是一个简单易用的解决方案。