布尔逻辑的模糊真值

时间:2015-01-31 19:39:23

标签: python excel algorithm pandas data-analysis

我试图在数据帧的函数中使用一些布尔逻辑,但得到一个错误:

在[4]中:

data={'level':[20,19,20,21,25,29,30,31,30,29,31]}
frame=DataFrame(data)
frame
Out[4]:
level
0   20
1   19
2   20
3   21
4   25
5   29
6   30
7   31
8   30
9   29
10  31

In [35]:

def calculate(x):
    baseline=max(frame['level'],frame['level'].shift(1))#doesnt work
    #baseline=x['level']+4#works
    difftobase=x['level']-baseline
    return baseline, difftobase
frame['baseline'], frame['difftobase'] = zip(*frame.apply(calculate, axis=1))#works

但是,这会在以下位置引发以下错误:

baseline=max(frame['level'],frame['level'].shift(1))#doesnt work


ValueError: ('The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().', u'occurred at index 0')

我看了How to look back at previous rows from within Pandas dataframe function call?http://pandas.pydata.org/pandas-docs/stable/gotchas.html  但无法弄清楚如何将此问题应用于我的问题?

1 个答案:

答案 0 :(得分:1)

最大功能使用不足np.maximum(可能是np.ma.max以及每个numpy文档)有效。显然,常规max不能处理数组(很容易)。替换

baseline=max(frame['level'],frame['level'].shift(1))#doesnt work

baseline=np.maximum(frame['level'],frame['level'].shift(1))

诀窍。我删除了另一部分以便于阅读:

In [23]:
#q 1 analysis
def calculate_rowise(x):
    baseline=np.maximum(frame['level'],frame['level'].shift(1))#works
    return baseline
frame.apply(calculate_rowise)

Out[23]:
level
0   NaN
1   20
2   20
3   21
4   25
5   29
6   30
7   31
8   31
9   30
10  31

PS原始问题隐藏了另一个在取出功能的移位部分时出现的问题。返回形状不匹配,但这是另一个问题,只需在此提及完整披露