我想做类似的事情:
if table['STATUS']=='A'or 'P':
table['END_DATE']=end_date
为了在STATUS中具有S或P的那些行替换END_DATE的值 产生了
ValueError: The truth value of an array is ambiguous. Use a.empty, a.any() or a.all().
我知道这是由于数组的地址... 这似乎是一个小问题,但我似乎无法找到合适的答案 什么是正确的构造在这里使用? 我无法从文档中找到它...说使用.any()
答案 0 :(得分:7)
if语句不明确,因为它计算的系列可能是空的,可能有一些True值或False值。因此无法评估。请参阅此处:http://pandas.pydata.org/pandas-docs/dev/gotchas.html#using-if-truth-statements-with-pandas,http://pandas.pydata.org/pandas-docs/dev/indexing.html#boolean-indexing,http://pandas.pydata.org/pandas-docs/dev/basics.html#flexible-comparisons
这适用于0.12
In [2]: df = DataFrame(np.arange(20).reshape(10,2),columns=['A','B'])
In [3]: df['status'] = ['A']*4 + ['invalid'] * 2 + ['P'] * 4
0.13
中不需要此步骤In [4]: df['end_date'] = np.nan
从@DSM编辑
In [5]: df.loc[(df['status'].isin(['A','P'])),'end_date'] = Timestamp('20130101')
In [6]: df
Out[6]:
A B status end_date
0 0 1 A 2013-01-01 00:00:00
1 2 3 A 2013-01-01 00:00:00
2 4 5 A 2013-01-01 00:00:00
3 6 7 A 2013-01-01 00:00:00
4 8 9 invalid NaN
5 10 11 invalid NaN
6 12 13 P 2013-01-01 00:00:00
7 14 15 P 2013-01-01 00:00:00
8 16 17 P 2013-01-01 00:00:00
9 18 19 P 2013-01-01 00:00:00