创建新列而不是for循环的更好方法

时间:2018-10-16 13:03:25

标签: python pandas performance for-loop

有没有更快速的方法来编写此代码? 我只想计算t_last-t_i并创建一个新列

time_ges = pd.DataFrame()
for i in range(0, len(df.GesamteMessung_Sec.index), 1):
    time = df.GesamteMessung_Sec.iloc[-1]-df.GesamteMessung_Sec.iloc[i]
    time_ges = time_ges.append(pd.DataFrame({'echte_Ladezeit': time}, index=[0]), ignore_index=True)

df['echte_Ladezeit'] = time_ges

此代码需要大量的计算时间,还有更好的方法吗? 谢谢,R

1 个答案:

答案 0 :(得分:2)

您可以按列GesamteMessung_Sec减去最后一个值,并添加to_frame以将Series转换为DataFrame

df = pd.DataFrame({'GesamteMessung_Sec':[10,2,1,5]})
print (df)
   GesamteMessung_Sec
0                  10
1                   2
2                   1
3                   5

time_ges = (df.GesamteMessung_Sec.iloc[-1] - df.GesamteMessung_Sec).to_frame('echte_Ladezeit')
print (time_ges )
   echte_Ladezeit
0              -5
1               3
2               4
3               0

如果需要原始DataFrame的新列:

df = pd.DataFrame({'GesamteMessung_Sec':[10,2,1,5]})
df['echte_Ladezeit'] = df.GesamteMessung_Sec.iloc[-1] - df.GesamteMessung_Sec
print (df)
   GesamteMessung_Sec  echte_Ladezeit
0                  10              -5
1                   2               3
2                   1               4
3                   5               0