os hour day
0 13 14 0
1 19 14 0
2 13 14 0
3 13 14 0
4 13 14 0
这是我的数据框,我只想获得一个新的str(os)+'_'+str(hour)+'_'str(day)
列。我使用apply函数来处理数据帧,但速度非常慢。
任何实现这一目标的高性能方法?
我也尝试将df转换为数组并处理每一行。它似乎也很慢。
数据帧有近两亿行。
答案 0 :(得分:1)
不确定您使用的代码是什么,但您可以尝试
df.astype(str).apply('_'.join, axis = 1)
0 13_14_0
1 19_14_0
2 13_14_0
3 13_14_0
4 13_14_0