.rar和.tar缺少Mime类型

时间:2014-10-01 19:48:33

标签: javascript jquery mime-types

Javascript(Windows 8.1,Firefox)似乎没有.tar文件或.rar文件的mime类型(也许还有其他人;这些是我发现的唯一两个)。那是什么?有什么我可以用来解决这个问题吗?我真的希望能够为这些文件类型检索mime类型,而不会做一些奇怪的扩展黑客攻击。

我努力证明这个问题:http://jsfiddle.net/kungfujoe/jd8h7wvs/

如果浏览到.txt或.docx或其他许多格式,则会成功提取类型。但是,.tar和.rar都不会拉它们。奇怪,对吧?

(JSFiddle代码如下)

HTML

<input id='button' type='file' name='file'/>
<div id='out'>Output Goes Here</div>

Javascript(使用JQuery 2.1.0)

$('#button').unbind('change');
$('#button').bind('change', function () {
    if(this.files[0] !== undefined && this.files[0] !== null) {
        document.getElementById("out").innerHTML = "Type is " + this.files[0].type.toString();        
    } else {
        throw "Error"
    }
});

由于

修改

1)更新了问题,以反映在Windows 8.1 Firefox上观察到此问题。 Chrome有tar文件的mime类型,但不是rar文件。

2)向小提琴添加了jQuery

1 个答案:

答案 0 :(得分:12)

JQuery只包含大多数浏览器中使用的底层File API,因此JQuery和Javascript如何处理文件和mime类型没有区别。这是File API规范:

http://www.w3.org/TR/FileAPI/#dfn-type

您正在操作的File对象从Blob对象继承类型属性,浏览器使用blob(字节数组)来确定mime类型。

为了完成该任务,每个浏览器都实现了一个文件嗅探算法,以便从字节数组中“读取”mime类型,如果mime类型不匹配,它将返回一个空字符串,就像上面的场景一样。

以下是完整的算法规范:

https://mimesniff.spec.whatwg.org/

所以现在你想知道为什么它对TAR,ZIP和RAR文件不起作用,为什么它适用于某些人而不适合你?...因为文件嗅探算法显然不完美。

它使用字节模式匹配,这似乎不够可靠。

例如,我在Windows 8框中使用WinRaR压缩文件,创建文件的初始字节为:

52 61 72 21 1A 07 00

但是,要将其识别为.RAR,浏览器字节模式匹配算法需要

52 61 72 20 1A 07 00

如您所见,存在细微差别,当我使用上面的代码将我的RAR文件上传到浏览器时,Firefox无法识别Mime-Type,我在type属性中得到一个空字符串。

然而,当我使用WinRar在同一台机器上使用默认设置打包ZIP文件时,它生成一个50 4B 03 04的初始字节数组序列,与算法所期望的zip字节模式匹配,当我使用你的上面的代码能够正确检测mime类型为 application / zip

从你的解释中可以看出,这是一个序列化的问题,以及算法的“不完美”,它将序列化的字节与浏览器中的mime扩展相匹配。

基于上面提到的所有内容,我建议不要依赖于mime嗅探,而是使用自定义代码来确定mime类型或现有库。您可以使用服务器端或客户端方法。

如果您想坚持使用客户端,可以使用以下JS库:

https://github.com/rsdoiel/mimetype-js

然后发现mime类型将是一行代码的问题:

mimetype.lookup("myfile.rar")

这是一个工作小提琴,升级你的例子使用mimetype js:

http://jsfiddle.net/jd8h7wvs/4/