应用错误收集

拆分BZip2无法正常工作

时间：2014-09-09 11:56:05

标签： hadoop compression hdfs yarn bzip2

我在Hadoop中有1.2GB文件，在BZip2编解码器中压缩。我们的Hadoop YARN群集有 10个节点。 HDFS 块大小为128 MB ，因此我认为该文件已拆分为10个块。 BZip2应该是可拆分的编解码器，所以我想当我开始处理输入文件时，Hadoop执行10个map任务（每个块一个）。但是当我查看作业日志时，我只能看到一个Map任务。

我没有找到任何限制YARN中映射器数量的设置（与Hadoop 1相比）。

我错过了什么或我做错了什么？

谢谢

1 个答案:

答案 0 :(得分：0)

我从未使用过BZip2，但我认为此问题可能与您的fileInputFormat有关。您可能还需要配置fileInputFormat，请查看此answer。

拆分NSString无法正常工作
拆分Environment.NewLine不工作
拆分BZip2无法正常工作
EF6：表拆分不起作用
bzip命令不能使用“tee -a”
分裂顺序不适用于magento
React-Code-Splitting不工作
官方bzip2网站离线
浏览器扩展程序无法与代码拆分一起使用

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？