Scala中数组的统计模式

时间:2017-12-13 02:47:58

标签: arrays scala apache-spark spark-dataframe mode

我需要找到数组的统计模式。考虑

  

val data = Array(101,100,101,100,100,100,103,100,100,100,101,101,150,150,150,151,150,150,150,150)

[以上'数据'数组是样本一。]实际上,数组包含200个值,我需要使用Scala为每个连续的10个数据点找到统计模式值(常见的最多发生值)。

任何有用的想法都会受到赞赏。

1 个答案:

答案 0 :(得分:1)

data.grouped(10).map(_.groupBy(identity).mapValues(_.size).maxBy(_._2)._1).toList