用Java确定Zip Archive中的文件内容类型

时间:2012-11-09 07:12:21

标签: java archive unzip

使用的环境是Google App Engine。该zip文件已在BlobStore中上传。

我有以下代码:

ZipInputStream zis = ...
ZipEntry ze = zis.getNextEntry();
while( ze != null){
    System.out.println(ze.getName());
    ze = zis.getNextEntry();
}

如何确定zip存档中每个文件的内容类型? ze.getName方法显示文件的名称。文件类型怎么样?

由于

1 个答案:

答案 0 :(得分:9)

您可以使用mime type而不是尝试通过文件扩展名来猜测,在某些情况下可能会丢失。以下是建立文件mime type的选项:

  1. 使用javax.activation.MimetypesFileTypeMap,例如:

    System.out.println("Mime Type of " + f.getName() + " is " +
        new MimetypesFileTypeMap().getContentType(f));
    
  2. 使用java.net.URL

    URL u = new URL(fileUrl);
    URLConnection uc = u.openConnection();
    type = uc.getContentType();
    
  3. 使用Apache Tika

    ContentHandler contenthandler = new BodyContentHandler();
    Metadata metadata = new Metadata();
    metadata.set(Metadata.RESOURCE_NAME_KEY, f.getName());
    Parser parser = new AutoDetectParser();
    // OOXMLParser parser = new OOXMLParser();
    parser.parse(is, contenthandler, metadata);
    System.out.println("Mime: " + metadata.get(Metadata.CONTENT_TYPE));
    System.out.println("Title: " + metadata.get(Metadata.TITLE));
    System.out.println("Author: " + metadata.get(Metadata.AUTHOR));
    System.out.println("content: " + contenthandler.toString());
    
  4. 使用JMimeMagic

    MagicMatch match = parser.getMagicMatch(f);
    System.out.println(match.getMimeType()) ;
    
  5. 使用mime-util

    Collection<?> mimeTypes = MimeUtil.getMimeTypes(f);
    
  6. 使用DROID

    Droid (Digital Record Object Identification) is a software tool to 
    perform automated batch identification of file formats.
    
  7. Aperture框架

    Aperture is an open source library and framework for crawling and indexing
    information sources such as file systems, websites and mail boxes.
    
  8. 有关上述每个选项的详细信息,请参阅Get the Mime Type from a File

    在这种情况下,最简单的方法是使用第一个解决方案javax.activation.MimetypesFileTypeMap,如:

    MimetypesFileTypeMap mtft = new MimetypesFileTypeMap();
    String mimeType = mtft.getContentType(ze.getName());
    System.out.println(ze.getName()+" type: "+ mimeType);