我有此数据框,并希望添加另一列累加直到不等于星形符号*
,然后在星形符号再次出现时从1重新开始。
Star
0 *
1 *
2 *
3 *
4 s
5 s
6 *
7 *
预期输出:
Star Number
0 * 1
1 * 2
2 * 3
3 * 4
4 s NaN
5 s NaN
6 * 1
7 * 2
答案 0 :(得分:5)
这是一个简单的groupby
和屏蔽操作。
m = df.Star.ne('*')
# Big thanks to @W-B for the bug fix!
df['Number'] = df[~m].groupby(m.cumsum()).cumcount().add(1)
df
Star Number
0 * 1.0
1 * 2.0
2 * 3.0
3 * 4.0
4 s NaN
5 s NaN
6 * 1.0
7 * 2.0
答案 1 :(得分:3)
来自itertools
groupby
import itertools
df['New']=sum([list(range(len(list(y)))) for _ , y in itertools.groupby(df.Star.tolist())],[])
df.loc[df.Star.ne('*'),'New']=np.nan
df.New+=1
df
Out[1152]:
Star New
0 * 1.0
1 * 2.0
2 * 3.0
3 * 4.0
4 s NaN
5 s NaN
6 * 1.0
7 * 2.0