标签: java apache-tika
我正在用Java中的tika解析器从pdf,word文档和PPT中提取内容,并且我不希望tika解析器读取文档中的超链接,但是默认情况下,它会被抓取并引起问题。
如何配置tika解析器不索引文件中的外部链接?