如何使用Pandas数据框定义将新列中的值分类的函数?

时间:2019-07-17 01:29:29

标签: python pandas csv

例如,我有一个数据框,其中包含“ datetime”作为索引,而列“ a”作为变量。我想获得每一行的信息,它们属于哪些分位数,例如,我想仅在特定日期使用以下4种级别的类别。

因此,在“类别”列中,它将显示第1行属于2019-05-02数据的第一类。

logger.info(str.format(("Skipping {0} because its thumbnail was already"
+ "in our system as {1}"), line[indexes['url']], video.title))

请不要介意计算。如何定义函数以创建新列?谢谢!

1 个答案:

答案 0 :(得分:0)

找到方法:

data['category'] = data.groupby(pd.Grouper(freq='D'))['a'].transform(
                 lambda x: pd.qcut(x, 4, labels=range(1,5)))

来源: Pandas groupby and qcut