基于Series条件创建新的pandas列

时间:2017-06-23 19:19:35

标签: python r pandas dataframe

RPython,我似乎无法根据有条件检查其他列来找出创建新列的简单案例。

# In R, create a 'z' column based on values in x and y columns
df <- data.frame(x=rnorm(100),y=rnorm(100))
df$z <- ifelse(df$x > 1.0 | df$y < -1.0, 'outlier', 'normal')
table(df$z)
# output below
normal outlier 
     66      34 

尝试使用Python中的等效语句:

import numpy as np
import pandas as pd
df = pd.DataFrame({'x': np.random.standard_normal(100), 'y': np.random.standard_normal(100)})
df['z'] = 'outlier' if df.x > 1.0 or df.y < -1.0 else 'normal'

但是,抛出以下异常: ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().

达到此目的的pythonic方法是什么?非常感谢:))

2 个答案:

答案 0 :(得分:3)

试试这个:

`DisplayMemberBinding="{Binding IsOK }"

答案 1 :(得分:1)

如果您想对列进行元素运算,则无法像这样对您的列进行处理。 使用numpy where