针对多个列

时间:2017-03-28 15:24:03

标签: python python-2.7 pandas

我想在df中创建一个新列,此列的值将映射到其他几列的值。

目前我有这个:

df['PLATFORM'] = df['ID_1'].map(lambda x: 'ID_1_MATCH' if x == 9 else 0)
df['PLATFORM'] = df['ID_2'].map(lambda x: 'ID_2_MATCH' if x == 10 else 0)
df['PLATFORM'] = df['ID_3'].map(lambda x: 'ID_3_MATCH' if x == 11 else 0)

使用此方法,新列中的值将覆盖在第二个和第三个映射上(其中x与lambda表达式的条件匹配)。我只想更新列,在前一个映射之后,仍然有一个0值。

是否有办法以分层方式将值映射到新列,具体取决于其他几列中的行值?

2 个答案:

答案 0 :(得分:3)

我认为你需要numpy.where

df['PLATFORM'] = np.where(df['ID_1']  == 9, 'ID_1_MATCH', 
                 np.where(df['ID_2']  == 10, 'ID_2_MATCH', 
                 np.where(df['ID_3']  == 11, 'ID_3_MATCH', 0 )))

样品:

df = pd.DataFrame({'ID_1':[9,2,3,4],
                   'ID_2':[4,10,6,1],
                   'ID_3':[7,8,11,0]})

print (df)
   ID_1  ID_2  ID_3
0     9     4     7
1     2    10     8
2     3     6    11
3     4     1     0

df['PLATFORM'] = np.where(df['ID_1']  == 9, 'ID_1_MATCH', 
                 np.where(df['ID_2']  == 10, 'ID_2_MATCH', 
                 np.where(df['ID_3']  == 11, 'ID_3_MATCH', 0 )))
print (df)
   ID_1  ID_2  ID_3    PLATFORM
0     9     4     7  ID_1_MATCH
1     2    10     8  ID_2_MATCH
2     3     6    11  ID_3_MATCH
3     4     1     0           0

答案 1 :(得分:1)

使用位掩码仅设置条件为真的行。

这比任何地图或lambdas更加惯用(和更快)。

>>> df = pandas.DataFrame(columns=['x', 'y'], data=[[0,1], [1,2]])
>>> df
   x  y
0  0  1
1  1  2
>>> df.ix[df['x'] % 2 == 0, 'match'] = 'x is even'
>>> df.ix[df['y'] % 2 == 0, 'match'] = 'y is even'
>>> df
   x  y      match
0  0  1  x is even
1  1  2  y is even
>>>