外部链接在Tika中爬行-Java

时间:2018-07-21 11:04:26

标签: java apache-tika

我正在用Java中的tika解析器从pdf,word文档和PPT中提取内容,并且我不希望tika解析器读取文档中的超链接,但是默认情况下,它会被抓取并引起问题。

如何配置tika解析器不索引文件中的外部链接?

0 个答案:

没有答案