将DataFrame值转换为int,添加它们并使用结果创建新列?

时间:2019-05-18 05:26:09

标签: python pandas

我有一个非常大的字符串数字数据框,例如:

a,b,c
"1","2","3"
"4","5","6"
"7","8","9"

我想创建一个新列d并添加a + c,这样最终结果将是:

a,b,c,d
1,2,3,4
4,5,6,10
7,8,9,16

我仍在尝试仅将a + c的列转换为字符串,但是我不知道如何将它们加在一起并创建结果的新列。请帮助解决最后一个问题!

1 个答案:

答案 0 :(得分:3)

我认为read_csv将列转换为整数。

因此使用:

df = pd.read_csv(file)
df['d'] = df['a'] + df['c']

但是如果失败,请尝试转换为整数或浮点数:

df = pd.read_csv(file)
df['d'] = df['a'].astype(int) + df['c'].astype(int)
#floats 
#df['d'] = df['a'].astype(float) + df['c'].astype(float)

如果数字之间也可能存在一些字符串,则可以将问题值转换为NaN并求和:

df = pd.read_csv(file)
df['d'] = pd.to_numeric(df['a'], errors='coerce') + pd.to_numeric(df['c'],  errors='coerce')