熊猫:计算连续的重复项(不带循环)并将列添加到原始DataFrame

时间:2019-11-28 11:47:44

标签: python pandas dataframe

import pandas as pd
value = [1,1,2,2,2,1,2,2,2,3,3,4]
df = pd.DataFrame(value)

df['count'] = [2,2,3,3,3,1,3,3,3,2,2,1]

我想生成'count'列,但不生成循环,因为原始数据很大。

是否有功能或其他有效的方法来做到这一点?

1 个答案:

答案 0 :(得分:4)

GroupBy.transform用于由shift d列和necount)创建的,由助手{{1}为连续的组添加cumsum

Series