标签: java excel ms-word formatting
我有一个文件formatting.doc。它里面有一些文字。现在我在文档中的文本中添加了一些格式。我在第一段开头之前增加了空格,强调了一些单词,用粗体表达了一些单词,并对该段进行了集中论证。
在我的应用程序中,我尝试使用Apache POI读取文件,然后使用iText以PDF格式显示。但是,Apache POI返回的文本是原始数据。即没有任何格式化。
Java中是否有任何方法可以读取文件的所有格式文本?
答案 0 :(得分:0)
我相信您最好的选择是使用Apache Tika。它使用Apache POI和一些其他库,并提供格式化提取等。