我想在df
中创建一个新列,此列的值将映射到其他几列的值。
目前我有这个:
df['PLATFORM'] = df['ID_1'].map(lambda x: 'ID_1_MATCH' if x == 9 else 0)
df['PLATFORM'] = df['ID_2'].map(lambda x: 'ID_2_MATCH' if x == 10 else 0)
df['PLATFORM'] = df['ID_3'].map(lambda x: 'ID_3_MATCH' if x == 11 else 0)
使用此方法,新列中的值将覆盖在第二个和第三个映射上(其中x
与lambda表达式的条件匹配)。我只想更新列,在前一个映射之后,仍然有一个0值。
是否有办法以分层方式将值映射到新列,具体取决于其他几列中的行值?
答案 0 :(得分:3)
我认为你需要numpy.where
:
df['PLATFORM'] = np.where(df['ID_1'] == 9, 'ID_1_MATCH',
np.where(df['ID_2'] == 10, 'ID_2_MATCH',
np.where(df['ID_3'] == 11, 'ID_3_MATCH', 0 )))
样品:
df = pd.DataFrame({'ID_1':[9,2,3,4],
'ID_2':[4,10,6,1],
'ID_3':[7,8,11,0]})
print (df)
ID_1 ID_2 ID_3
0 9 4 7
1 2 10 8
2 3 6 11
3 4 1 0
df['PLATFORM'] = np.where(df['ID_1'] == 9, 'ID_1_MATCH',
np.where(df['ID_2'] == 10, 'ID_2_MATCH',
np.where(df['ID_3'] == 11, 'ID_3_MATCH', 0 )))
print (df)
ID_1 ID_2 ID_3 PLATFORM
0 9 4 7 ID_1_MATCH
1 2 10 8 ID_2_MATCH
2 3 6 11 ID_3_MATCH
3 4 1 0 0
答案 1 :(得分:1)
使用位掩码仅设置条件为真的行。
这比任何地图或lambdas更加惯用(和更快)。
>>> df = pandas.DataFrame(columns=['x', 'y'], data=[[0,1], [1,2]])
>>> df
x y
0 0 1
1 1 2
>>> df.ix[df['x'] % 2 == 0, 'match'] = 'x is even'
>>> df.ix[df['y'] % 2 == 0, 'match'] = 'y is even'
>>> df
x y match
0 0 1 x is even
1 1 2 y is even
>>>