Pandas DataFrame - 在for循环中添加列与另一种方法

时间:2017-08-06 12:05:57

标签: python-3.x pandas for-loop dataframe

我们在存储在实时商店中的一段时间内测量了n个点(比如22个点)。现在我们正在寻找对上述各点趋势的一些了解。为了获得目标,我们将测量结果读入pandas DataFrame(python)。在此DataFrame中,现在列和行都是相应的测量时间。

我们希望通过为每个现有列插入'mean'和'std'列来扩展带有mean和std的新列的数据框,这是一个特定的度量。这意味着每22个测量点有两个新列。

现在的问题是,在迭代现有列时是否最好能够添加新的mean和std列,还是在操作或技巧中构建了另一个更有效的DataFrame?

我们的理解是,在for循环中更新DataFrame到目前为止是最糟糕的做法。

感谢您提出任何意见或建议。

1 个答案:

答案 0 :(得分:1)

从评论中我想这就是你要找的 -

import pandas as pd 
import numpy as np 

df = pd.DataFrame(np.random.normal(size = (1000,22))) # created an example dataframe
df.loc[:, 'means'] = df.mean(axis = 1)
df.loc[:, 'std'] = df.mean(axis = 1)