pandas将函数应用于列数组非常慢

时间:2018-04-02 03:50:26

标签: pandas

  os  hour  day
0  13    14    0
1  19    14    0
2  13    14    0
3  13    14    0
4  13    14    0

这是我的数据框,我只想获得一个新的str(os)+'_'+str(hour)+'_'str(day)列。我使用apply函数来处理数据帧,但速度非常慢。 任何实现这一目标的高性能方法? 我也尝试将df转换为数组并处理每一行。它似乎也很慢。 数据帧有近两亿行。

1 个答案:

答案 0 :(得分:1)

不确定您使用的代码是什么,但您可以尝试

df.astype(str).apply('_'.join, axis = 1)

0    13_14_0
1    19_14_0
2    13_14_0
3    13_14_0
4    13_14_0