在Pandas DataFrame Python中添加新列

时间:2013-09-22 09:50:45

标签: python pandas dataframe

我在Pandas中有数据框,例如:

Col1 Col2
A     1 
B     2
C     3

现在,如果我想再添加一个名为Col3的列,并且该值基于Col2。在式中,如果Col2> 1,然后Col3为0,否则为1.所以,在上面的例子中。输出将是:

Col1 Col2 Col3
A    1    1
B    2    0
C    3    0

关于如何实现这一目标的任何想法?

2 个答案:

答案 0 :(得分:61)

你只是做了相反的比较。 if Col2 <= 1。这将返回一个布尔值系列,其值为False,大于1,True值为另一个。如果您将其转换为int64 dtype,则True变为1False变为0

df['Col3'] = (df['Col2'] <= 1).astype(int)

如果您想要一个更通用的解决方案,您可以根据Col3的值为Col2分配任何数字,您应该执行以下操作:

df['Col3'] = df['Col2'].map(lambda x: 42 if x > 1 else 55)

或者:

df['Col3'] = 0
condition = df['Col2'] > 1
df.loc[condition, 'Col3'] = 42
df.loc[~condition, 'Col3'] = 55

答案 1 :(得分:0)

我发现将列添加到DataFrame的最简单方法是使用&#34; add&#34;功能。这是一段代码,也是输出到CSV文件的代码片段。请注意,包括&#34;列&#34;参数允许您设置列的名称(恰好与我用作数据源的np.array的名称相同)。

#  now to create a PANDAS data frame
df = pd.DataFrame(data = FF_maxRSSBasal, columns=['FF_maxRSSBasal'])
# from here on, we use the trick of creating a new dataframe and then "add"ing it
df2 = pd.DataFrame(data = FF_maxRSSPrism, columns=['FF_maxRSSPrism'])
df = df.add( df2, fill_value=0 )
df2 = pd.DataFrame(data = FF_maxRSSPyramidal, columns=['FF_maxRSSPyramidal'])
df = df.add( df2, fill_value=0 )
df2 = pd.DataFrame(data = deltaFF_strainE22, columns=['deltaFF_strainE22'])
df = df.add( df2, fill_value=0 )
df2 = pd.DataFrame(data = scaled, columns=['scaled'])
df = df.add( df2, fill_value=0 )
df2 = pd.DataFrame(data = deltaFF_orientation, columns=['deltaFF_orientation'])
df = df.add( df2, fill_value=0 )
#print(df)
df.to_csv('FF_data_frame.csv')