Thinbug
News
如何使用tika从ppt中提取内容?
时间:2017-12-20 07:38:28
标签:
apache-tika
其他程序员!我使用tika提取了一个ppt文件,它只有纯文本。但是,tika给出内容类型的结果是jpg格式!所以我的问题是如何处理它我只想要那个要检测为纯文本类型的案例。
1 个答案:
答案 0 :(得分:0)
我在tika中更改了一些源代码,因此我可以获得我想要的内容。通过这种方式,我可以提取ppt文件并获得正确的结果。
相关问题
从.ppt幻灯片中提取信息
如何阅读.ppt中的内容
从未知内容类型的文档中提取文本
如何用tika提取.ppt文件的文本?
提取标签'来自视频/图像的元数据
如何使用tika从ppt中提取内容?
如何使用Tika提取office2003 ppt文件?
如何使用Apache Tika仅从.ppt中提取文本
Apache Tika无法从印度语言的PDF中正确提取文本
如何使用python中的tika包从ppt中读取单个幻灯片?
最新问题
我写了这段代码,但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值,但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场?
是否有可能使 loadstring 不可能等于打印?卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用?
在此代码中是否有使用“this”的替代方法?
在 SQL Server 和 PostgreSQL 上查询,我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源?