应用错误收集

sqoop成更多小尺寸的部件

时间：2017-03-09 21:03:32

标签： hadoop sqoop2 bigdata

我有sqoop stmt和10个映射器。 hadoop中的整个数据分为10个部分，每个部分超过1GB。我想把数据分成多个较小部分的文件，不用说超过10个，就像每个200MB的50个文件。但是由于DB瓶颈问题，我无法在sqoop中创建超过10个映射器。如果有任何简单的解决方案，请告诉我。

1 个答案:

答案 0 :(得分：0)

在直接模式下有一个解决方案。

您可以使用--direct-split-size（ in Bytes ）

示例：--direct-split-size 200000000将生成大约的文件。 200 MB。

查看here了解详情。