我的火花数据框看起来像:
ItemId date sale-amount
111 01-01 45
111 01-02 33
111 01-03 55
222 01-01 20
222 01-02 33
333 01-01 21
333 01-02 33
333 01-03 9
我想创建3个单独的数据框,以包含具有数据和销售额的单个项目,就像项目111一样:
Df_111:
ItemId date sale-amount
111 01-01 45
111 01-02 33
111 01-03 55
我知道,我可以通过在原始数据框架上逐个过滤所有item_id来实现这一点,但还有更有效的方法吗?