应用错误收集

Content-Type不是问题...如果文件是csv，那是正确的，但是如果你将它们存储为gzip，那么你需要也设置{{1}在标头元数据中。这样做“应该”触发那些在下载时抓取他们动态枪杀它们的用户......所以你做到了，它应该“只是工作了”。

（我使用Content-Encoding: gzip和Content-Type: text/plain以这种方式存储gzip压缩日志文件，当您使用网络浏览器下载时，您获取的文件不再被gzip压缩，因为浏览器会解压缩压缩文件由于Content-Encoding标头而飞。）

但是，既然你已经上传了文件，我确实在谷歌机器上找到了这个，这可能有所帮助：

GZipped输入。我的很多输入数据都已被gzip压缩，但幸运的是，如果你在额外的参数部分传递Content-Encoding: gzip，Hadoop会在传递数据之前动态解压缩它们到你的映射器。