我知道这可能已经在某个地方问了,但我找不到问题/答案(也许是因为我是熊猫新手)。所以这就是:
如果我想从pandas数据框计算一个新列,我可以这样做:
df['col_b'] = df.col_a + 100
但我无法做到这样的事情:
df['col_c'] = str(df.col_a) + 'c'
我知道我可以使用apply()方法并传递lambda或函数。但是这对于大型数据集(一百万行)来说通常看起来非常慢,而且我无法访问索引值。是否有更好(更快)的方法来进行这种操作?
修改
我知道我提供了一个简单的字符串连接问题。但我对更复杂的情况(如日期时间操作)更通用的最佳实践感兴趣。