从Scalding UnsortedGrouped中查找最大值[String,Set [MyStuff]]

时间:2016-04-14 16:06:48

标签: java scala scalding

我需要做以下事情:

  • 通过一些String属性
  • 对我的记录进行分组
  • 丢弃太大的群组
  • 检索其余每个组中的最大元素

这是我到目前为止所得到的:

val records: TypedPipe[MyStuff] = ...
records
  .groupBy(_.getThatStringProperty)
  .toSet
  .filter(_._2.size < 10)
  ....

我最终得到UnsortedGrouped[String, Set[MyStuff]]。我怎样才能找到最大的&#39;每个组的MyStuff是否优雅,可并行化,并且内存要求最低?

1 个答案:

答案 0 :(得分:0)

.mapValues { _.max }应该这样做