我有一个非常大的字符串数字数据框,例如:
a,b,c
"1","2","3"
"4","5","6"
"7","8","9"
我想创建一个新列d
并添加a + c
,这样最终结果将是:
a,b,c,d
1,2,3,4
4,5,6,10
7,8,9,16
我仍在尝试仅将a + c
的列转换为字符串,但是我不知道如何将它们加在一起并创建结果的新列。请帮助解决最后一个问题!
答案 0 :(得分:3)
我认为read_csv
将列转换为整数。
因此使用:
df = pd.read_csv(file)
df['d'] = df['a'] + df['c']
但是如果失败,请尝试转换为整数或浮点数:
df = pd.read_csv(file)
df['d'] = df['a'].astype(int) + df['c'].astype(int)
#floats
#df['d'] = df['a'].astype(float) + df['c'].astype(float)
如果数字之间也可能存在一些字符串,则可以将问题值转换为NaN
并求和:
df = pd.read_csv(file)
df['d'] = pd.to_numeric(df['a'], errors='coerce') + pd.to_numeric(df['c'], errors='coerce')