根据另一个值填充新的pandas df列

时间:2018-09-05 04:10:41

标签: python pandas where fill

我试图在column中创建一个新的pandas df,并用另一个column中的值填充。具体来说,对于下面的df,我要在1中的'Home'值旁边填充Col['Location']

import pandas as pd

d = ({
    'Day' : ['Mon','Tues','Mon','Wed','Thurs','Fri','Mon','Sat','Sun','Tues'],                 
    'Location' : ['Home','Home','Away','Home','Home','Home','Home','Home','Home','Away'],               
     })

df = pd.DataFrame(data=d)

我目前正在通过此方法进行操作:

m = lambda x: dict(Home='1').get(x, '')
df = df.assign(Assign=df.Location.map(m))

但是,我想包含Col['Day']来更改新的列值。我希望在三个分配中分配assign个数字。对于Day中的前三个唯一值,我想将它们全部标记为1。对于第4、5、6个唯一值,我想将其标记为2等。

因此,对于Location df的Home值,unique中的前3个Day值是Mon, Tues, Wed,因此它们旁边都将有1个值。第四,第五,第六唯一值是Thurs, Fri, Sat,因此它们旁边将有2Sun已超过6,因此它将有一个3

预期输出:

     Day Location Assign
0    Mon     Home      1
1   Tues     Home      1
2    Mon     Away       
3    Wed     Home      1
4  Thurs     Home      2
5    Fri     Home      2
6    Mon     Home      1
7    Sat     Home      2
8    Sun     Home      3
9   Tues     Away       

1 个答案:

答案 0 :(得分:1)

我认为首先仅过滤Home行,删除重复项并为map创建字典-但仅适用于过滤后的行:

mask = df['Location'] == 'Home'
df1 = df[mask].drop_duplicates('Day')
d = dict(zip(df1['Day'], np.arange(len(df1)) // 3 + 1))

df.loc[mask, 'Assign'] = df.loc[mask, 'Day'].map(d)
print (df)
     Day Location  Assign
0    Mon     Home     1.0
1   Tues     Home     1.0
2    Mon     Away     NaN
3    Wed     Home     1.0
4  Thurs     Home     2.0
5    Fri     Home     2.0
6    Mon     Home     1.0
7    Sat     Home     2.0
8    Sun     Home     3.0
9   Tues     Away     NaN

如果要整数列:

df['Assign'] = np.where(mask, df['Day'].map(d), 0)
print (df)
     Day Location  Assign
0    Mon     Home       1
1   Tues     Home       1
2    Mon     Away       0
3    Wed     Home       1
4  Thurs     Home       2
5    Fri     Home       2
6    Mon     Home       1
7    Sat     Home       2
8    Sun     Home       3
9   Tues     Away       0

如果没有问题,混合数字和空字符串:

df['Assign'] = np.where(mask, df['Day'].map(d), '')
print (df)
     Day Location Assign
0    Mon     Home      1
1   Tues     Home      1
2    Mon     Away       
3    Wed     Home      1
4  Thurs     Home      2
5    Fri     Home      2
6    Mon     Home      1
7    Sat     Home      2
8    Sun     Home      3
9   Tues     Away