如何使用tika从ppt中提取内容?

时间:2017-12-20 07:38:28

标签: apache-tika

其他程序员!我使用tika提取了一个ppt文件,它只有纯文本。但是,tika给出内容类型的结果是jpg格式!所以我的问题是如何处理它我只想要那个要检测为纯文本类型的案例。

1 个答案:

答案 0 :(得分:0)

我在tika中更改了一些源代码,因此我可以获得我想要的内容。通过这种方式,我可以提取ppt文件并获得正确的结果。