我试图在数据帧的函数中使用一些布尔逻辑,但得到一个错误:
在[4]中:
data={'level':[20,19,20,21,25,29,30,31,30,29,31]}
frame=DataFrame(data)
frame
Out[4]:
level
0 20
1 19
2 20
3 21
4 25
5 29
6 30
7 31
8 30
9 29
10 31
In [35]:
def calculate(x):
baseline=max(frame['level'],frame['level'].shift(1))#doesnt work
#baseline=x['level']+4#works
difftobase=x['level']-baseline
return baseline, difftobase
frame['baseline'], frame['difftobase'] = zip(*frame.apply(calculate, axis=1))#works
但是,这会在以下位置引发以下错误:
baseline=max(frame['level'],frame['level'].shift(1))#doesnt work
ValueError: ('The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().', u'occurred at index 0')
我看了How to look back at previous rows from within Pandas dataframe function call? 和http://pandas.pydata.org/pandas-docs/stable/gotchas.html 但无法弄清楚如何将此问题应用于我的问题?
答案 0 :(得分:1)
最大功能使用不足np.maximum(可能是np.ma.max以及每个numpy文档)有效。显然,常规max不能处理数组(很容易)。替换
baseline=max(frame['level'],frame['level'].shift(1))#doesnt work
与
baseline=np.maximum(frame['level'],frame['level'].shift(1))
诀窍。我删除了另一部分以便于阅读:
In [23]:
#q 1 analysis
def calculate_rowise(x):
baseline=np.maximum(frame['level'],frame['level'].shift(1))#works
return baseline
frame.apply(calculate_rowise)
Out[23]:
level
0 NaN
1 20
2 20
3 21
4 25
5 29
6 30
7 31
8 31
9 30
10 31
PS原始问题隐藏了另一个在取出功能的移位部分时出现的问题。返回形状不匹配,但这是另一个问题,只需在此提及完整披露