熊猫:仅从某些列创建新数据框

时间:2016-04-09 14:22:14

标签: python csv pandas

我有一个包含测量值的csv文件,我想创建一个包含每小时平均值和标准偏差的新csv文件。但仅适用于某些专栏。

示例:

csv1:

YY-MO-DD HH-MI-SS_SSS    |     Acceleration  |        Lumx     |    Pressure
2015-12-07 20:51:06:608  |        22.7       |        32.3     |     10
2015-12-07 20:51:07:609  |        22.5       |        47.7     |     15

到csv 2(仅适用于压力和加速度:

 YY-MO-DD HH-MI-SS_SSS       | Acceleration avg  |   Pressure avg
    2015-12-07 20:00:00:000  |        22.6       |        12.5     
    2015-12-07 21:00:00:000  |        ....       |        ....    

现在我有一个想法(感谢本网站上的人)关于如何计算平均值 - 但我在创建一个包含几列计算的新的较小数据框时遇到了麻烦。

谢谢!!!

1 个答案:

答案 0 :(得分:1)

csv2 = csv1.loc[:, ['Acceleration', 'Pressure']]
  • .loc[]有助于保持子设置操作的明确性和一致性。

  • .loc[]始终返回一个副本,因此原始数据帧不会被修改。

(有关进一步的讨论和不同的view vs. copy替代方案的精彩示例,请参见:Pandas: Knowing when an operation affects the original dataframe