我有一个包含测量值的csv文件,我想创建一个包含每小时平均值和标准偏差的新csv文件。但仅适用于某些专栏。
示例:
csv1:
YY-MO-DD HH-MI-SS_SSS | Acceleration | Lumx | Pressure
2015-12-07 20:51:06:608 | 22.7 | 32.3 | 10
2015-12-07 20:51:07:609 | 22.5 | 47.7 | 15
到csv 2(仅适用于压力和加速度:
YY-MO-DD HH-MI-SS_SSS | Acceleration avg | Pressure avg
2015-12-07 20:00:00:000 | 22.6 | 12.5
2015-12-07 21:00:00:000 | .... | ....
现在我有一个想法(感谢本网站上的人)关于如何计算平均值 - 但我在创建一个包含几列计算的新的较小数据框时遇到了麻烦。
谢谢!!!
答案 0 :(得分:1)
csv2 = csv1.loc[:, ['Acceleration', 'Pressure']]
.loc[]
有助于保持子设置操作的明确性和一致性。
.loc[]
始终返回一个副本,因此原始数据帧不会被修改。
(有关进一步的讨论和不同的view vs. copy
替代方案的精彩示例,请参见:Pandas: Knowing when an operation affects the original dataframe)