我正在使用Apache Tika进行文档内容解析,并且只对特定文件格式感兴趣(例如,doc,docx等)。但是,当我使用包含视频的Microsoft Word文件(作为嵌入文件)时,我看到下面的错误:
java.lang.NoClassDefFoundError: com/googlecode/mp4parser/DataSource
我怀疑这是因为tika正在尝试解析嵌入的.mp4文件内容而无法找到依赖类。由于我对解析嵌入的文件内容不感兴趣,有人可以告诉我有没有办法在tika中禁用它?
提前致谢。