蒂卡:OOXMLParser是什么意思?

时间:2018-08-17 10:55:46

标签: java apache-tika

当前,我们正在使用以下代码获得mime类型:

public String getMimeType(ByteArrayInputStream bais) {

    Detector detector = new DefaultDetector();
    Metadata metadata = new Metadata();

    try {
        MediaType mediaType = detector.detect(TikaInputStream.get(bais), metadata);
        String mimetype = mediaType.toString();

        //================================
        if (null != mimetype && mimetype.contains("ooxml")) {
            BodyContentHandler handler = new BodyContentHandler();
            ParseContext pcontext = new ParseContext();

            OOXMLParser msofficeparser = new OOXMLParser();
            msofficeparser.parse(bais, handler, metadata, pcontext);
            return metadata.get(Metadata.CONTENT_TYPE);
        }
        //================================

        return mimetype;
    } catch (TikaException | IOException | SAXException e) {
        throw new DocumentException("Unable to find out MimeType ", e);
    }
}

我们只需要获取mime类型。问题是:是否有必要在//===========之间使用此附加代码才能获得它?

我们试图注释此代码,看来它选择了正确的mime类型,但我们不了解此代码段的含义。

我希望我解释得很好...

我们检测到,如果对此特定代码段进行了注释,则

0 个答案:

没有答案