mapTo如何比Scalding中的map更有效

时间:2014-09-05 20:57:08

标签: scala scalding

Github上的Scalding引用(https://github.com/twitter/scalding/wiki/Fields-based-API-Reference#map-functions)说明如下:

  

MapTo相当于映射然后投影到新字段,但效率更高。因此,以下两行产生相同的结果:

     

pipe.mapTo(existingFields -> additionalFields){ ... } pipe.map(existingFields -> additionalFields){ ... }.project(additionalFields)

我的问题是:

  • mapTo如何比map更高效?

1 个答案:

答案 0 :(得分:2)

由于您指明了剩余的字段,因此在执行map操作时,无需保留将要丢弃的字段。

根据丢弃的字段数量和数据量,差异可能非常明显。