在Apache Tika中禁用嵌入式文件内容解析

时间:2018-06-15 07:10:28

标签: java apache-tika

我正在使用Apache Tika进行文档内容解析,并且只对特定文件格式感兴趣(例如,doc,docx等)。但是,当我使用包含视频的Microsoft Word文件(作为嵌入文件)时,我看到下面的错误:
java.lang.NoClassDefFoundError: com/googlecode/mp4parser/DataSource

我怀疑这是因为tika正在尝试解析嵌入的.mp4文件内容而无法找到依赖类。由于我对解析嵌入的文件内容不感兴趣,有人可以告诉我有没有办法在tika中禁用它?

提前致谢。

0 个答案:

没有答案