按组在Python Sframe中创建滞后变量

时间:2016-06-03 14:38:21

标签: python lag sframe

您好我正在尝试为python Sframe中的一组组识别滞后变量。

我使用的代码是:

sf['lag'] = sf.groupby(['Group'])['Num'].shift(1)

但是我收到了错误:

  

TypeError:groupby()至少需要3个参数(给定2个)

1 个答案:

答案 0 :(得分:1)

您需要指明您希望groupby运算符执行哪些聚合函数。例如

import sframe
import sframe.aggregate as agg

grp = sf.groupby(key_columns='Group', 
                 operations={'count': agg.COUNT('Group')})

查看https://dato.com/products/create/docs/generated/graphlab.SFrame.groupby.html#graphlab.SFrame.groupby

上的文档