Hadoop Map输出类型用于性能

时间:2012-10-11 18:25:37

标签: hadoop mapreduce

我有一堆字段要由Mapper在10个字段周围写出来。 哪种方式会更快 1.将字段写为以下

    tradeDate.readFields(in);
    marketMakerId.readFields(in);
    eventTime.readFields(in);
    bidPrice.readFields(in);
    ......................... 

或2.将它们转换为单个文本字段(tradeDate,marketId,evenTime,bidPrice ....)并在Reducer上构造对象。

哪种方式可以提供更好的性能?

1 个答案:

答案 0 :(得分:1)

与往常一样,基准可能有所帮助。您可以使用Caliper来检查假设。

但一般来说,二进制格式更快,当涉及文本< - >二进制转换时。 因此,我认为二进制读/写字段的工作速度会更快。