我正在寻找能够产生尽可能接近原始结果的解决方案,例如this example,它会转换.doc而不是.ppt文件。理想情况下,它应该使用FileInputStream
并输出带有所需html代码的String
。
我遇到了this question,它发布的代码与Apache POI网站上的代码非常相似,但它会转换为图片,而我却无法重新定位它。< / p>
否则,似乎旁边没有代码可以做到这一点。
修改
我尝试过实施Apache Tika解决方案,但是我遇到了解析器问题。我已经看到有几个人在Android上实现这个库时遇到了这个问题,但我还没有看到有人提出解决方案。
我的代码如下:
HSLFSlideShow powerpointDoc = new HSLFSlideShow(inputDocument);
inputDocument.close();
List<HSLFSlide> slides = powerpointDoc.getSlides();
ContentHandler handler = new ToXMLContentHandler();
AutoDetectParser parser = new AutoDetectParser();
Metadata metadata = new Metadata();
for (int i = 0; i <= slides.size(); i++) {
parser.parse(inputDocument, handler, metadata);
}
String result = handler.toString();
有人能举例说明我如何使用Apache Tika吗?