Github上的Scalding引用(https://github.com/twitter/scalding/wiki/Fields-based-API-Reference#map-functions)说明如下:
MapTo相当于映射然后投影到新字段,但效率更高。因此,以下两行产生相同的结果:
pipe.mapTo(existingFields -> additionalFields){ ... } pipe.map(existingFields -> additionalFields){ ... }.project(additionalFields)
我的问题是:
答案 0 :(得分:2)
由于您指明了剩余的字段,因此在执行map
操作时,无需保留将要丢弃的字段。
根据丢弃的字段数量和数据量,差异可能非常明显。