我有一个这样的DataFrame:
column1 column2 column3
0 a 2 2
1 b 1 0
2 c 3 2
第3列中的值必须为<=第2列中的值
我想根据以下规则将df扩展到下面:
column1 column2 column3
0 a 1 1
1 a 1 1
2 b 1 0
3 c 1 1
4 c 1 1
5 c 1 0
例如: 看到column1 = a的行被扩展为2行,因为它的column2值等于2,并且由于0 <2和1 <2,两个结果扩展行在column3中的值都为1。
看到column1 = c的行被扩展为3行,因为它的column2值等于3,但是,只有前2个扩展行在column3中的值为1(再次:0 <2和1 < 2),但是,第三扩展行的column3的值为0,因为(是,是,这不是幼儿园数学)2 <2是不正确的。
我可以在第一个给定的数据帧上使用什么功能,以获得类似于第二个的结果?
答案 0 :(得分:2)
np.repeat
+ cumcount
u = pd.DataFrame(np.repeat(df.values, df.column2, axis=0), columns=df.columns)
u.assign(
column2=1,
column3=(u.column3 > u.groupby('column1').cumcount()).astype(int)
)
column1 column2 column3
0 a 1 1
1 a 1 1
2 b 1 0
3 c 1 1
4 c 1 1
5 c 1 0
答案 1 :(得分:1)
我认为这是合并问题
s1=df.loc[df.index.repeat(df.column2),['column1']].assign(column2=1).reset_index(drop=True)
s2=df.loc[df.index.repeat(df.column3),['column1']].assign(column3=1).reset_index(drop=True)
df=s1.assign(Key=s1.groupby(s1.column1).cumcount()).merge(s2.assign(Key=s2.groupby(s2.column1).cumcount()),how='left').fillna(0)
df
column1 column2 Key column3
0 a 1 0 1.0
1 a 1 1 1.0
2 b 1 0 0.0
3 c 1 0 1.0
4 c 1 1 1.0
5 c 1 2 0.0