在没有安装graphlab的情况下在SFrame中分组

时间:2016-07-20 22:52:30

标签: python numpy group-by graphlab sframe

如何在SFrame中使用groupby操作,而无需安装graphlab。

我很乐意做一些聚合,但在互联网上的所有例子中,我都看到聚合函数来自Graphlab。

像:

import graphlab.aggregate as agg

user_rating_stats = sf.groupby(key_columns='user_id',
                          operations={
                                'mean_rating': agg.MEAN('rating'),
                                'std_rating': agg.STD('rating')
                            })

如何在上面的示例中使用numpy.mean而不是agg.MEAN

1 个答案:

答案 0 :(得分:3)

sframe包包含与graphlab包相同的聚合模块,因此您不需要求助于numpy。

import sframe
import sframe.aggregate as agg

sf = sframe.SFrame({'user_id': [1, 1, 2],
                    'rating': [3.3, 3.6, 4.1]})
grp = sf.groupby('user_id', {'mean_rating': agg.MEAN('rating'),
                             'std_rating': agg.STD('rating')})
print(grp)

+---------+---------------------+-------------+
| user_id |      std_rating     | mean_rating |
+---------+---------------------+-------------+
|    2    |         0.0         |     4.1     |
|    1    | 0.15000000000000024 |     3.45    |
+---------+---------------------+-------------+
[2 rows x 3 columns]