我们在存储在实时商店中的一段时间内测量了n个点(比如22个点)。现在我们正在寻找对上述各点趋势的一些了解。为了获得目标,我们将测量结果读入pandas DataFrame(python)。在此DataFrame中,现在列和行都是相应的测量时间。
我们希望通过为每个现有列插入'mean'和'std'列来扩展带有mean和std的新列的数据框,这是一个特定的度量。这意味着每22个测量点有两个新列。
现在的问题是,在迭代现有列时是否最好能够添加新的mean和std列,还是在操作或技巧中构建了另一个更有效的DataFrame?
我们的理解是,在for循环中更新DataFrame到目前为止是最糟糕的做法。
感谢您提出任何意见或建议。
答案 0 :(得分:1)
从评论中我想这就是你要找的 -
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.normal(size = (1000,22))) # created an example dataframe
df.loc[:, 'means'] = df.mean(axis = 1)
df.loc[:, 'std'] = df.mean(axis = 1)