如何使用Java格式从文件(word文档,excel)读取数据?

时间:2016-03-29 18:25:08

标签: java excel ms-word formatting

我有一个文件formatting.doc。它里面有一些文字。现在我在文档中的文本中添加了一些格式。我在第一段开头之前增加了空格,强调了一些单词,用粗体表达了一些单词,并对该段进行了集中论证。

在我的应用程序中,我尝试使用Apache POI读取文件,然后使用iText以PDF格式显示。但是,Apache POI返回的文本是原始数据。即没有任何格式化。

Java中是否有任何方法可以读取文件的所有格式文本?

1 个答案:

答案 0 :(得分:0)

我相信您最好的选择是使用Apache Tika。它使用Apache POI和一些其他库,并提供格式化提取等。