我正在使用Apache Tika从文档中提取元数据。我最感兴趣的是建立一个基本的都柏林核心,如作者,标题,日期等。我根本不对文档的内容感兴趣。目前我只是在做通常的事情:
FileInputStream fis = new FileInputStream( uploadedFileLocation );
// Tika parsing
Metadata metadata = new Metadata();
ContentHandler handler = new BodyContentHandler();
AutoDetectParser parser = new AutoDetectParser();
parser.parse(fis, handler, metadata);
有没有办法告诉Tika 不解析内容?我希望这会加快速度并节省内存。