使用Spark:binning column1并根据column1&#39s的bin找到column2的平均值

时间:2016-04-13 19:16:33

标签: scala apache-spark binning

我正在学习apache spark和scala语言。所以请一些帮助。我从查询cassandra获得3列( c1 c2 c3 )并将其放入scala代码中的数据框中。我必须bin(bin size = 3)(统计数据,如直方图) c1 ,并在c1箱中找到 c2 c3 的平均值。是否有任何预先构建的功能,我可以使用它来代替传统的for循环,如果有条件实现这一点?

1 个答案:

答案 0 :(得分:0)

试试这个

<template name="index">
  {{#if (display 'mainMenu')}}
    {{> mainMenu}}
  {{else}} {{#if (display 'content')}}
    {{> Template.dynamic template="content" data=taskInputs}}
  {{/if}}{{/if}}
</template>