Word文档到html解析器,保留所有文本样式(下标,上标,项目符号等)

时间:2014-08-15 12:36:10

标签: java apache-poi apache-tika

我已经阅读了很多Tika指南和手册,但我无法弄清楚如何创建一个Tika-Poi单词文档解析器,它保留下标,上标,子弹等内容样式。我可以让它保持粗体和斜体,但注意到更多。

有人可以提供一些提示,或者参考一些示例代码吗?

感谢您的帮助!

0 个答案:

没有答案