从Spark Dataframe创建集合的有效方法

时间:2017-02-18 21:06:42

标签: scala apache-spark spark-dataframe

我的火花数据框看起来像:

ItemId  date   sale-amount
111    01-01  45
111    01-02  33
111    01-03  55
222    01-01  20
222    01-02  33
333    01-01  21
333    01-02  33
333    01-03   9

我想创建3个单独的数据框,以包含具有数据和销售额的单个项目,就像项目111一样:

Df_111:

ItemId  date   sale-amount
    111    01-01  45
    111    01-02  33
    111    01-03  55

我知道,我可以通过在原始数据框架上逐个过滤所有item_id来实现这一点,但还有更有效的方法吗?

0 个答案:

没有答案