Apache Tika - 解析MS Word - 避免嵌入文档

时间:2015-12-22 14:12:10

标签: apache-tika

我必须处理MS Office文件,其中作者可能嵌入了多个其他文件(word,excel,pdf,...),但我只想解析父文档的内容。

是否有可能以这种方式配置Tika?

0 个答案:

没有答案