进行Scalding MapReduce操作我需要在元组字段上使用我自己的比较函数来比较元组。
问题:
谢谢!
答案 0 :(得分:0)
您可以创建虚拟字段(例如,使用com.twitter.scalding.RichPipe#map
),按此字段排序然后将其删除。以下是基于Scalding Documentation:
val users = Csv(file_source, separator = ",", fields = Schema)
.read
.map ('age-> 'ageInt) {x:Int => x}
.groupAll { _.sortBy('ageInt) } // will sort age as a number.
.discard ('ageInt)