根据多个条件创建Pandas Dataframe列

时间:2017-07-27 12:38:04

标签: python python-3.x pandas

我正在尝试根据代码中显示的多个条件创建一个新列。 我有一个jp_hol的字典,它在日本有假期,我的数据帧有一个字符串的日期列,以及函数中使用的所有其他列 但是我在下面得到这个错误,有人可以帮我解决问题

  

系列的真值是模棱两可的。使用a.empty,a.bool(),   a.item(),a.any()或a.all()。

我的代码:

def flag():
    if (load['date'].isin([i for i in jp_hol.keys()]) |(load['day_of_week_int']==6)):
         l='holiday'
    elif load['day_of_week_int'].isin([i for i in range(0,5)]): 
         l='weekday'
    elif load['day_of_week_int']==5:
         l='sat'
return l
load['flag']=load.apply(flag(),axis=1

注意:如果假日在工作日,那么假期应优先于工作日。

1 个答案:

答案 0 :(得分:1)

所有掩码创建TrueFalse系列,因此可以使用numpy.where

m1 = load['date'].isin([i for i in jp_hol.keys()]) | (load['day_of_week_int']==6)
m2 = load['day_of_week_int'].isin([i for i in range(0,5)])
m3 = load['day_of_week_int']==5


load['flag']=np.where(m1, 'holiday',
             np.where(m2, 'weekday',
             np.where(m3, 'sate', 'no match')))

样品:

load = pd.DataFrame({'A':list('abcdef'),
                   'B':[4,5,4,5,5,4],
                   'C':[7,8,9,4,2,3],
                   'D':[1,3,5,7,1,0],
                   'E':[5,3,6,9,2,4],
                   'F':list('aaabbb')})

print (load)
m1 = load['B'] == 5
m2 = load['C'] >5
m3 = load['F'] == 'a'

print (pd.concat([m1,m2,m3], axis=1))
       B      C      F
0  False   True   True
1   True   True   True
2  False   True   True
3   True  False  False
4   True  False  False
5  False  False  False

load['flag']=np.where(m1, 'holiday',
             np.where(m2, 'weekday',
             np.where(m3, 'sate', 'no match')))

print (load)
   A  B  C  D  E  F      flag
0  a  4  7  1  5  a   weekday
1  b  5  8  3  3  a   holiday
2  c  4  9  5  6  a   weekday
3  d  5  4  7  9  b   holiday
4  e  5  2  1  2  b   holiday
5  f  4  3  0  4  b  no match