Apache Tika将AC3文件解析为application / octet-stream而不是audio / ac3

时间:2017-12-22 21:01:25

标签: java apache mime-types apache-tika

提供AC3音频文件作为输入,获取InputStream并将其传递给Apache Tika。

虽然库在其mime类型XML中列出了audio / ac3,但它无法识别类型。它适用于其他标准媒体类型。

任何人都知道如何解决这个问题。

Metadata metadata = new Metadata();
metadata.add(Metadata.RESOURCE_NAME_KEY, fileName);    
TikaConfig config = TikaConfig.getDefaultConfig();
MimeTypes mimeTypes = config.getMimeRepository();
tikaMediaType = mimeTypes.detect(new BufferedInputStream(inputStream), metadata);

1 个答案:

答案 0 :(得分:3)

您需要使用较新版本的Apache Tika!

具体来说,Apache Tika 2.0,或者从2017-12-24或之后的Github每晚构建/构建。

最近才通过this commit to the project

添加了AC3和EAC3文件的mime检测魔力